0.0 题记 这个世界从不缺语言和计算,把他们好好的合在一起,就可以变成LLM。 0.1 序 这是一系列的文章,或许很多类似的知识都会出现在各种自媒体和书籍中,但是我想从语言学的视角来谈谈这些问题。同时使用最简单的语言展开我的叙述。所以请不要说书面语体的事情。这些都是基础知识,我会从最初的计算机一步…
请仔细在电脑上阅读完原文再操作,同时如果有不懂的请及时询问chatgpt等ai,并且上网查询。也可以发邮件联系我。(请查看上面联系站长)顺便感谢一下他们开源出GPU版本的模型供我们使用。 简介 这是一个利用NDL古典籍OCR技术将古典文献资料转换为文本数据的应用程序。版本3相较于之前版本在汉籍资料的…
找不到材料,做不了研究。(巧妇难为无米之炊)。 无法搜索的材料都是鸡肋。 引子 笔者之前在知乎上看到这样一个问题,怎样查全一个方向的文献?底下各路大佬纷纷出…
最近研究需要,偶得一份完整版,分享出來吧。順便說一下,我目前這個系統可能會出問題(下方是版本號)。本地服務無法啟動。然後呢,請解壓完所有壓縮包,直接解到文件夾,不用解壓到打包文件夾。 如果有需要非百度雲鏈接,我本月上傳OneDrive資源站。如果鏈接掛了,請聯繫站長。 Edition Windows…
https://nk2028.shn.hk/cht/ 內容請君點擊访问
https://languageresources.github.io/ 点击访问
寶卷是用人話講佛經的書,我到處尋找,發現了一些。點擊訪問即可。 國內 日本東方學デジタル圖書館 牛津也有但是沒有放出,無限循環套娃。 如果遇到想找的書,可以私聊站長,說不定我有。
古音小鏡 復旦大學中華文明數據中心 奎章閣
点击《说文解字注》
内有广韵等,请点击访问。 点我访问
韵典网
更新一批来自哈佛大学图书馆齊如山藏書,可以很方便的预览,我将其整理成PDF和图片,这样方便本地查看。 点击前往 注意,我分了文件夹,有些书是无PDF的。因为缺页,我就不去合成了,源数据文件(json)附在文件夹里面,请查看。 一个很不好的点就是有些书出现插页情况,我很难在一堆有顺序的链接中找到插的那…
http://netdrive.tmzncty.cn 基于ondmanager打造,很多书还在上传,要其他书请顶部联系站长。
凡讀書者,尋書之難,可謂一絕。今與之數方,願獲書易也。 首爲網站焉,余偶得網站,可尋書也。 聚BT此站整理甚多,無需吾列之。 另有一方,百度云搜索。若文件之多,可尋會員也,書得,錢又何妨。 還有一方,TELEGRAM也若可富強上網,則無妨也。亦可私聊站長,余多搬運下載也。
由於列表太大,所以請點擊,直接使用瀏覽器查找功能即可。 漢語資料 一堆經典資料(怎麼說呢,竟然要付費,實在是要的話再看吧,互聯網已經不像以前了。)
先挖個坑,筆者偶得一系列古籍數據庫,但是由於網絡速度,還沒完整下載並整理。之前的參見網絡數據庫(記得調整編碼爲UTF-8)
筆者研究古漢語,有時候需要全文查找,一個一個打開文件勢必不便。現在網上發現一款查找軟件,可以完成全文查找工作。下載鏈接或者前往軟件官網下載。順便說一下,記得安裝在非C盤,不然索引會占很大空間。 新的古文數據庫來自http://122.200.75.13/ 或者github。 筆者這個是本…
2021年3月25日,國學大師網站關閉,無法查找,所幸我同學保留了它的所有軟件,以下爲下載鏈接。 《四库全书》繁体无标点 世界名著合集 二十四史正史野史 国学精选 国学迷 4亿字 新华字典+成语词典.rar 汉字宝典3.6(可查15万字33种工具书) FTP【這個就是以上的集合 用戶名“tmznct…
請點擊鏈接。目前還有很多沒加上去,慢慢完善2021-05-31 13:44:17 星期一
据说WORD可以写HTML,这么好的可视化工具怎么能不用呢,这就来试试 写点最近的研究感受吧 书其实怎么说呢,洋人的书装订质量还是好一些,可以完全翻开的地步。不过这也不完全,我倒也没去买英文原版的其他书,仅有一本罗素的《西方哲学史》。 列个单子 有生之年系列: 1. 罗素——《西方哲学史》 …