人们想方设法的把所有东西转化为语言,并以此为认知。
今天继续测试人工智障,我觉得有些智障就先训练得了,不要放出来。死东西谁都会,一旦拐弯那就没办法了。建议这些AI下次出来先去智障吧体验一回,知道什么叫人类语言的模糊性再出来。
- roniez : 哈哈,chatgpt表现可能好一点,可惜注册不了
- 題目自擬闖天涯 博主 : 有注册方法,直接百度或者微信搜索就行。但是现在很迷,时不时不回答问题。Discord也没太多人提到。
请用Python实现快速幂
学科和学术的关系是啥?
如何知道我的意思表达清楚了?
这东西本来是可以写成文章的,但是我直接谈经验比较好,而且我是喜欢本地化的。(进了自己脑子的东西才是自己的东西。)
全文搜索软件比如说ANYTXT和Archivarius3000,对于电脑配置的要求较高,除非你只进行TXT或者WORD单文件搜索,那样请随意。但是一旦涉及整个文件夹或者整个机子的文本搜索,为了保证搜索结果的准确性和搜索速度,请使用16G内存(memory)以上的设备。以及index存放地点为SSD(固态硬盘)。如果不担心速度,只需要能实现,请忽略第二条,内存达到16G即可。(内存频率和通道数无明显影响。)
此外,EmEditor也有搜索对应文件夹内所有TXT的功能,但是有点烧内存,请自行测试。如果使用正则搜索,则烧CPU。
努力到死都不知道未来在哪,是很可悲的。
把文档看了,软件装遍,无人会,PCB。休说咸鱼坑人,尽奸诈,淘宝又贵,求型问价,怕成灵车。电商财气,可惜疫情。
上面的线
底下的房
从空灵中走出
上面的电线不忘强调自己过去的辉煌
对面的高楼可能是以后的模样
但它们可能不会被标准化
因为那些招牌在护着它
笑死,还不是为了活着,好好的活下去。
总之千万不要被自己的学科禁锢,
不要说自己的研究方向不在那边就不去搞,
后续带来的就是效率甚至更多东西的损失。
在生存的焦虑中找回自己的存在
- 论如何建立自己的研究体系
- 如何开展数字时代的人文研究
- 从语言到语言,利用语言研究语言
- 如何提高数字时代的学科素养
book.tmzn.top
原理很简单,内网1G远程桌面就行。笔电HDMI外接1080P,typec接4K(参考我上一篇文章)。这样高度提高工作效率。目前笔电主屏幕显示服务器端内容,另外两个显示笔电内容。
- yifeng : 好可爱啊
- 題目自擬闖天涯 博主 : 嗯嗯(≧∇≦*)
其實就是插件的事情,但是許多插件推薦中提到的vscode-pdf無法閲讀有文字標注層的pdf文件,需要另一個(latex workshop)。我測試了別的一些插件,貌似都不怎麽行。
邮箱tmzn@foxmail.com
预告:什么时候出一篇各大图书馆IDM下载教程。这东西我很早就在用,但是知道的人不多,。
- fuckbaidu : 求出教程
- 題目自擬闖天涯 博主 : 已经写了https://tmzncty.cn/post/311/
我大概量了一下,目前5T的书是有了,在E5.什么时候弄个搜索站出来,方便大家使用。
点名批评联想备件数量,我高高兴兴的去换板子。第一块板子花屏。那没事啊,再来一块。第二块不花了,反而是卡死了。两块板子都是返修板子。不是全新的。我就很迷惑了,不至于没全新备件吧。最终问题解决了但没有完全解决,因为HDMI还是坏的,用C转HDMI继续玩。系统换成稳定的10,似乎整体都好了一点。
原因很简单,我笔电的HDMI接口坏了
坏了就坏了嘛,找保修不就行了?于是乎和女孩子一起去找,结果她的问题小,一下子解决。然后我的要换板子,需要三天。联想真的是绝了,(其实都是一样,集成在一起)坏了就直接换板子。接着等了三天,对方说板子还不行,花屏。那就等吧,过了两天,好了。总所周知,问题是没有那么快解决的,当把硬盘装进去的时候,有出现账户无法登录问题。我用DISM++打开Administrator后,成功验机。回去后也成功登录原有账户,心血来潮打开2077,I/O过大,直接卡死。后续蓝牙多次卡死,从B乎找到什么禁用再启用得到解决。刚刚又蓝牙问题,绝了,继续折腾吧。I/O突然增大的时候,很可能卡掉蓝牙,重启服务,重启设备,重新开关,蓝牙就好了。
你就先這樣再那樣最後完成了嘛
拿到不同時代的不同文本的TXT版本后,進行分詞(能夠細分詞性的那種,我什麽時候去找一下)處理。
然後進行各種分析統計字詞頻率變化,基本就可以水玩了。
- 东君 : 進行分詞,如何分词呀?有啥工具没?
- 題目自擬闖天涯 博主 : 分词有工具,最简单是python的jieba库。其他还有清华的分词平台等。注意分完后自己瞄一眼,以免出现错误。
关于OCR
我把知道的东西说一下吧,也是我从14年到现在的一点点经验。
- 古籍方面。目前国内有一些要钱的库,比如说爱如生、鼎秀、雕龙、书同文、大成故纸堆等。这些OCR的模型是没放出来的,是人家吃饭的本。GITHUB上有可能有模型,但是效果懂得都懂。之前阿里和加州大学伯克利分校搞了一个,但是最后什么都没有放出来,离谱。浙大古籍平台可以去看看,但是错误也是有的,我最后来说。还有一个就是基于百度API的手写识别,这个效果也就是那样。
- 普通中、英文字符。目前遍地开花,最方便是QQ,其次是微软和百度。还有隔壁的ABBYY(需要请去我书库翻一下,第一个文件夹的软件文件夹里面找找)这些大同小异,不足为奇,而且免费。无聊的可以去玩paddleOCR,但是门槛有,不是抄代码的我能解决的。
- 现状。均通过各种算法想方设法识别字,却不会运用NLP去辅助认字,乱码就是这样出现的。还有就是不公开模型,弄得又要从头再来。报价各家还不低,有是有办法,反正我看不下去这些公司的吃相。
- 使用差异,QQ别扫手写,认不出来的。特殊符号也有办法,这个我没研究,可以转换为latex(但是错误摆在这。)千百OCR是好东西,API受限罢了,我是自有API,随意。微软认一些吧,手写没办法。ABBYY是拿来压PDF然后搜索的,这样舒服点,错误就错,90%对的就行。
CADAL的百度盘已经拿到了,下了大概1.3T,还在转存。之前115根本没用,谷歌盘不全。
什么时候弄点软件推荐吧,也好整理一下我的书库。
大晚上的接地府
不得不说,爱奇艺就是个垃圾东西。非要客户端下载,下载也不能转换,迭代连编码都改。为何我们只能这样耍小聪明当创新?转换器也自然只能转换之前版本的。国内厂商的阴间地方就在这,供给侧改革的地方也在这。不好好思考供应,却把顾客当傻子。