国产成人精品亚洲777人妖,欧美日韩精品一区视频,最新亚洲国产,国产乱码精品一区二区亚洲

您的位置:首頁技術(shù)文章
文章詳情頁

java - hadoop數(shù)據(jù)查找

瀏覽:151日期:2024-02-06 11:45:32

問題描述

使用hadoop查找文件中是否含有某些字符串,也就是要查找出set(string)中每個string對應(yīng)的那一行,每條數(shù)據(jù)都不重復(fù),請問怎么可以快速的找到呢?我寫了簡單的

# map.shawk -F '03' ’$3==xxx{print $0}’ -

結(jié)果慢的要死,一直動不都不懂,請問有快點的辦法嗎?最好是可以一次性找出集合中所有的

問題解答

回答1:

這個寫MR吧,如果你想省事就把數(shù)據(jù)導(dǎo)入到hive中,用sql 來解決

標簽: java
相關(guān)文章:
主站蜘蛛池模板: 邻水| 石家庄市| 阿拉善右旗| 上饶县| 康平县| 赣榆县| 峨山| 揭东县| 无为县| 出国| 江城| 临西县| 农安县| 太仓市| 分宜县| 兴化市| 沙洋县| 洪雅县| 安福县| 太湖县| 黔南| 夏津县| 论坛| 桃源县| 迭部县| 九龙坡区| 辽阳县| 石泉县| 黄浦区| 嘉兴市| 攀枝花市| 巴彦县| 襄城县| 徐闻县| 曲靖市| 吉隆县| 泸西县| 隆回县| 阿克陶县| 贵德县| 桂林市|