国产成人精品亚洲777人妖,欧美日韩精品一区视频,最新亚洲国产,国产乱码精品一区二区亚洲

您的位置:首頁(yè)技術(shù)文章
文章詳情頁(yè)

mysql - 5千萬(wàn)文章,怎么做相關(guān)文章?

瀏覽:144日期:2022-06-12 18:04:51

問(wèn)題描述

現(xiàn)在我是按標(biāo)題分詞,每個(gè)標(biāo)題3個(gè)詞單獨(dú)建了個(gè)tags表,用來(lái)存放分的詞,每個(gè)詞一條記錄,讀取相關(guān)文章是隨機(jī)讀一條tag,之后查找tags表相同tag,以前數(shù)據(jù)少的時(shí)候還可以,現(xiàn)在tags表里1億多條數(shù)據(jù)了,讀起來(lái)超級(jí)慢tags表只有2個(gè)字段,一個(gè)文章id,分詞,都做了索引,之后分區(qū)。請(qǐng)問(wèn)還有其他方法做相關(guān)文章的么?現(xiàn)在每天新增數(shù)據(jù)5W+++

問(wèn)題解答

回答1:

相關(guān)性的衡量,應(yīng)該有好幾個(gè)維度:1,文章所屬板塊,比如娛樂(lè)2,文章中心思想或者主題是啥,要提取出來(lái)3,時(shí)間和主要對(duì)象(人物、事件)相關(guān)

一篇文章可能有多個(gè)主體對(duì)象,可能跨板塊進(jìn)行關(guān)聯(lián)

主站蜘蛛池模板: 登封市| 中牟县| 遵义县| 临桂县| 林芝县| 靖江市| 肥西县| 阜宁县| 剑阁县| 军事| 多伦县| 丰都县| 四子王旗| 新昌县| 宜章县| 原阳县| 崇州市| 长宁区| 新竹县| 巴林右旗| 汝州市| 都匀市| 延寿县| 江口县| 邯郸市| 来安县| 玉屏| 射洪县| 盐边县| 甘洛县| 侯马市| 永新县| 罗源县| 遵义市| 余庆县| 泸水县| 汝南县| 齐河县| 宝应县| 河北省| 九龙坡区|