數(shù)據(jù)分析 - java 數(shù)據(jù)挖掘分析求思路
問題描述
先說說我的想法吧:同時監(jiān)控淘寶上很多物品的價格,然后獲取價格走勢(這個我打算自己寫爬蟲獲取,然后存在數(shù)據(jù)庫里),但是問題來了
我該怎么存儲數(shù)據(jù),使我能分析哪些物品在最近2天或7天的價格波動最大(最好是任意天數(shù)),這個地方該怎么實現(xiàn)比較好。總不能說每天我都要遍歷一次數(shù)據(jù)庫來求價格的差值吧,能不能有經(jīng)驗的大師指點下。
問題解答
回答1:總不能說每天我都要遍歷一次數(shù)據(jù)庫來求價格的差值吧 是覺得開銷過大嗎?那就把熱點數(shù)據(jù)放Cache,過了這段熱點時間就持久化到數(shù)據(jù)庫。
熱點數(shù)據(jù)可以是但不限于:
這幾天剛采集的數(shù)據(jù)
最常常分析的日期段,比如2天、7天、1個月
回答2:這個和java沒關(guān)系吧
回答3:數(shù)據(jù)分析的方法和java不是強相關(guān)的,java從某種角度說只是一種工具,可以將你的想法交給計算完成,可以實現(xiàn)你與計算機(jī)的交流,有基于java相關(guān)的haoop生態(tài),可以了解一哈
回答4:需要分析的變動快的 --> 熱數(shù)據(jù) --> redis , 放在內(nèi)存;長期的歷史數(shù)據(jù) --> 冷數(shù)據(jù) --> mysql / oracle ,放在磁盤。
相關(guān)文章:
1. mysql - 記得以前在哪里看過一個估算時間的網(wǎng)站2. css3 - 純css實現(xiàn)點擊特效3. MySQL中的enum類型有什么優(yōu)點?4. javascript - 關(guān)于<a>元素與<input>元素的JS事件運行問題5. javascript - vue 怎么渲染自定義組件6. python - 啟動Eric6時報錯:’qscintilla_zh_CN’ could not be loaded7. mysql - 查詢字段做了索引為什么不起效,還有查詢一個月的時候數(shù)據(jù)都是全部出來的,如果分拆3次的話就沒問題,為什么呢。8. ID主鍵不是自增的嗎 為什么還要加null9. android下css3動畫非常卡,GPU也不差啊10. css - 新手做響應(yīng)式布局, 斷點過后右側(cè)出現(xiàn)空白,求幫助,謝謝。
