你就先這樣再那樣最後完成了嘛
拿到不同時代的不同文本的TXT版本后,進行分詞(能夠細分詞性的那種,我什麽時候去找一下)處理。 然後進行各種分析統計字詞頻率變化,基本就可以水玩了。
進行分詞,如何分词呀?有啥工具没?
分词有工具,最简单是python的jieba库。其他还有清华的分词平台等。注意分完后自己瞄一眼,以免出现错误。
進行分詞,如何分词呀?有啥工具没?
分词有工具,最简单是python的jieba库。其他还有清华的分词平台等。注意分完后自己瞄一眼,以免出现错误。