国产成人精品亚洲777人妖,欧美日韩精品一区视频,最新亚洲国产,国产乱码精品一区二区亚洲

您的位置:首頁技術(shù)文章
文章詳情頁

java字符串搜索匹配問題?

瀏覽:153日期:2024-01-16 14:46:25

問題描述

我有三萬多個詞匯和它們的詞性(就是動詞,名詞,形容詞或者副詞之類的),我想寫個函數(shù)把以參數(shù)的方式傳遞進(jìn)來的單詞進(jìn)行詞性分析,然后返回它的詞性。

public int analyze(String word){ // 這個地方應(yīng)該用什么來保存那三萬個詞匯 // 這個地方應(yīng)該用怎樣的數(shù)據(jù)結(jié)構(gòu)或算法來判斷word到底在不在我那個三萬個詞匯里面 // 怎么做才能功效地判斷出word的詞性 return wordType;}

詞匯-詞性表目前是單純的以行為單位的txt文件

word1 tword2 nword3 a

就這樣,我該怎么做呢,應(yīng)該用什么來存儲我的三萬行數(shù)據(jù),txt,json,xml,或者寫到代碼里面放到數(shù)組里面去呢?哪一個循環(huán)起來快一些,有什么好的建議?

問題解答

回答1:

你的具體用途是怎樣的,經(jīng)常用到,注重查詢效率?可以用map放內(nèi)存吧

如果不經(jīng)常使用,可以按首字母將詞分割成幾個文件,每次查詢都可以定位到某個文件,更快一點(diǎn)。說實(shí)話,三萬其實(shí)挺小的,讀起來應(yīng)該不慢,再夸張點(diǎn)你可以放數(shù)據(jù)庫。

如果有更好的想法再回復(fù)你

回答2:

可以試下hadoop的 map reduce 哦

標(biāo)簽: java
相關(guān)文章:
主站蜘蛛池模板: 达尔| 蚌埠市| 兴仁县| 沿河| 平顺县| 天柱县| 浑源县| 青龙| 丹寨县| 卓资县| 桃江县| 阿拉善盟| 海兴县| 泾源县| 环江| 临安市| 白朗县| 海口市| 女性| 汽车| 济南市| 清徐县| 永顺县| 民勤县| 修武县| 平南县| 乌兰察布市| 库尔勒市| 红原县| 四川省| 陇西县| 保德县| 收藏| 邵武市| 高唐县| 启东市| 措勤县| 巨野县| 赤壁市| 鞍山市| 枞阳县|