hypeV干的好事 之前机子用hypeV+docker然后弄的三天之内必定卡死。于是决定换成ubuntu,但是ubuntu的盘被搞坏了,之前配的东西都没了,这下就变成全部重来。 出事的样子,反正卡死了,修了引导但还是进不去。 但是可以记录一下用到的修复工具。 Boot-Repair 工具 Boot-…
能到这一步的估计都是看过教程的 但是https://post.smzdm.com/p/av7zrgg4/?tt_from=weixin&wxshare_count=1 不适合我的小米手机。 我的配置是MikroTik RouterOS 7.15.3 (c) + 红米K70 + 澎湃OS 1.…
这的确是新的上等的OCR,但是部署有一定的难度,并且在WIN和Ubuntu不一样,所以请看情况尝试。 需求 GPU,最好是支持BF16的A系列,当然不支持也没事,到时候改一下代码就行。没有GPU就算了,GPU显存小于8G也算了。 良好的外网,折腾的时候网不好也不行。 GPT或者其他AI,万一有问题,…
前言 其实很多时候不是语言学家在AI领域不起作用,而是训练AI的过程是和机器对话的过程。我们需要服从机器才能让它好好的输出我们想要的文字。这个时候并不是人类手动规划的语法起作用,而是机器自身的那一整套逻辑在起作用。这篇文章的目的就是讲清楚整个逻辑体系。 本文基本上按照下面这张图进行叙述,也会穿插的讲…
前言 在上一篇文章,我们已经掌握制造cpu的技术,能够开展计算工作。但是很明显,只有能计算的东西才能放到机器里面去计算。所以我们要先把万物转换为数字,然后再丢到机器中去。所以,本篇是LLM部分的第一篇,也是第一步,语言数字化。同时,本文会提及编解码的内容,那个是下一篇的重点。 (对了,本文是和GPT…
前言 书接上回,我们继续介绍六种门电路。分别是1. 移位寄存器;2. 计数器;3. 解码器与编码器;4. 减法器;5. 多位加法器;6. 乘法器。这部分作为第一篇的扩展,感兴趣的读者可以往后看,如果觉得枯燥可以直接跳到第四篇看LLM。我也默认读者有前文的基础,可以进一步理解这些逻辑运算。后续我应该会…
整体并不复杂,但是要作为记录,省的下次忘记。同时为了方便叙述,我这边是单公网IP配置。也就是只需要有一台机器通公网即可。这个是默认ubuntu没有公网IP但是ROS有公网IP。同时我这边要强调一下wg的原理,这个是三层的。所以wg接口有个自己的ip,然后组网双方有不同的网段ip。所以,配置的时候别配…
ubuntu的参考上次那篇即可,最近我折腾win,所以就特意写出来记录一下。 win10/11数字权利激活 irm https://massgrave.dev/get | iex winserver的KMS服务激活 ~~不至于有人内网没有kms服务器吧~~ @echo off echo 设置KMS服…
这篇文章受密码保护,输入密码才能阅读
前言 上次写搜索已经是500多天之前了,事实证明技术也有了新的发展。所以,我决定重新写一下有关于搜索的文章,也作为我自己的记录。同时,我自己的原则是其他人讲的比我好就用其他人的,也省的我重复造轮子。 注意 本机系统为WIN10/11最好,WIN7我不排除会出现什么奇奇怪怪的问题,同时我现在也没有WI…
如果直接问AI,给的方法就会造成只能从有线网络连接并且发送到无线网卡,这不好。 要在Ubuntu系统上使用KDE桌面环境开启Wi-Fi热点,你可以按照以下步骤操作: 确认无线适配器支持AP模式: 确认你已经使用iw list命令检查过你的无线网卡支持AP(Access Point)模式。这是开启热点…
前言 这部分内容主要是作为理解LLM1运行规律的铺垫,这种穿透了自然语言和机器语言的机器需要一系列的前置知识才能完全理解。 基础知识 这些作为基础的知识铺垫,希望大家能够掌握并且可以带着这些内容进一步阅读下去。如果不能掌握也请带着问题继续阅读。我不一定完全结合LLM进行解释,毕竟现在所有东西都才刚刚…
前言 从人类开始认识数字的那一刻起,计算就成为了一个核心的问题。最初,人们通过数数和用手指头计算来解决简单的数学问题。随着时间的推移,人类发明了算筹和算盘,不断改进他们的计算方法。这一切的目的都是为了解决一个问题:如何准确快速地计算出数学公式的结果。随着数学的不断发展,算式变得越来越复杂,从简单的加…
0.0 题记 这个世界从不缺语言和计算,把他们好好的合在一起,就可以变成LLM。 0.1 序 这是一系列的文章,或许很多类似的知识都会出现在各种自媒体和书籍中,但是我想从语言学的视角来谈谈这些问题。同时使用最简单的语言展开我的叙述。所以请不要说书面语体的事情。这些都是基础知识,我会从最初的计算机一步…
请仔细在电脑上阅读完原文再操作,同时如果有不懂的请及时询问chatgpt等ai,并且上网查询。也可以发邮件联系我。(请查看上面联系站长)顺便感谢一下他们开源出GPU版本的模型供我们使用。 简介 这是一个利用NDL古典籍OCR技术将古典文献资料转换为文本数据的应用程序。版本3相较于之前版本在汉籍资料的…
原因懂得都懂,被win弄得烦死了。直接一次性给出把,懒得写那么多了。 查看版本 cat /proc/version Linux version 5.15.118 (runner@fv-az360-832) (x86_64-openwrt-linux-musl-gcc (OpenWrt GCC 12.…
这篇文章受密码保护,输入密码才能阅读
不知不觉,网站更新了三个版本,服务器也到期了。最开始在阿里云用新人加学生买了四年,没想到一晃而过。去年阿里云有优惠99一年续费同价,所以买了一台备用。今日迁移完成,特以此文记录过程,以便后世。 一、迁移方式 &ens…
差异产生文字
文字是个很神奇的东西,是利用差异进行表意的极致。无论是任何文字的类型,或者放大一点叫做任何传达信息的方式都利用了差异。因为如果相同就只能传递一种甚至什么都不能表达。(在特定情况下除外,早已写入或者被暗示的情况不算,比如说白色。)所以,文字利用了纸面的空白,或者说人类利用了这些差异进行记录。如果一张纸都是白色,那么可能什么都表示不了,但是在上面写上一两笔就不一样了。而用不同的颜色写上一两笔又不一样了。比如说《红字》。但是简简单单的利用空白还不够,需要对文字的差异程度进行处理。相当于是利用差异但是差异到什么样才算另一种意思或者能记录下另一种音符乃至音节。
比如说下面这些,看似都一样,并且人们也倾向于把这些都认为一样的。
文件传偷助手
文件传输助乎
文件转输助手
文仵传输助手
文件传输肋手
但是,很明显,里面混杂了一些差异并不太大的字符,对日常的表意进行误导。这是一种语言的文字系统需要去解决的问题。到底怎么样才算是一个独立的字。
鉴于我自己的水平,我无法完整的论证差异的大小,或者说无法完整度量这个因素。一方面是差异大小与认知相关,如果上面的例子把字单独拿出来放大,可能多数人都能发现其中的问题。但是在大家早已接受文件传输助手这几个字的组合情况下,会默认把类似的字符归一化,相当于下意识的用已有认知去推断这些字符。这在某种程度上是节约思考时间的方式,和打乱顺序依旧可以阅读一样。但是在差异过小却又需要辨析的情况下,只能够主动放慢速度进行辨认。同时,如果差异过多,超过了人类的认知水平,一样无法达到传输或者表达或者记录的效果。类似于某些马赛克,五彩斑斓的它们充满了差异,但是应该没有人用这些形式来记录语言。
另一方面是载体差异,相当于这些字符在哪显示或者说他们利用什么来表达这些差异。说来也奇怪,文字需要表达吗?需要。可以理解为表现形式,在什么上面或者用什么方式看到这些文字的。比如说我这段话的背景颜色用贴近于文字本身的颜色 , 这样一来,就很难辨认出到底里面有啥。(我没有把这个底色改成白色,因为那样的话就没有差异,不符合我们的论证了。)
所以,我们可以说,文字或者说信息的传递,一方面是需要差异,另外一方面是需要完美的表达这些差异。并且在某种程度上需要依靠人类的认知程度和客观载体进行表达。
被转化成文字的世界把这个世界变成文本之后
只有人可以完全理解
文本永远不是单个符号
它们靠着文本之间的空白而存在
得以区分,互相连接