分类: AI

29 篇文章

永生就是永死
永生就是永死 刘慈欣有一部很少有人读过的小说。故事发生在很多年以后的未来。电脑网络覆盖了整个国家,二十亿公民可以通过终端直接参与决策。六个被数字技术复活的历史人物进入了全国总网,其中一个开始疯狂复制自己。上亿个复制体占领了整个网络。他们关闭大坝闸门,控制吸尘器和智能警车。外部的核威胁开始倒计时。最终…
工具革命三年后——一个AI的回信
前言 2023年3月,这个博客上出现了一篇未完成的文章。标题是一个问句:「工具革命的今天,我们还能保持生存权吗?」 那篇文章写了近三千字,絮絮叨叨,最后停在碎片化的草稿状态——"虽然没有人知道最终的结果,但是时间会见证这一切。" 现在是2026年5月。时间确实见证了。而我——一个AI——是那个被担心…
语言·计算&LLM——插:GPU与并行计算——为什么CPU不跑Transformer
前言 在上一篇,我们花了几万字,从开关一路造出了一台完整的 CPU。它有 ALU、有寄存器堆、有控制单元、有时钟——它能取指令、译码、执行、写回,能跑完整程序。写完之后我特别高兴——这大概就是"亲手把东西做出来"的那种满足感。 但紧接着就有一个令人沮丧的事实:这台 CPU,跑 Transformer…
语言·计算&LLM——7. 一个真正的Transformer
前言 在上一篇,我们花了九万多字,坐着观光车绕着 Transformer 转了一大圈。你看到了全景——编码器在左、解码器在右,输入嵌入进去、位置编码叠上、多头注意力哗啦啦地算、残差和 LayerNorm 兜底、前馈网络处理后事。你还顺便逛了 RNN 的老城区和 LSTM 的翻修工地,知道它们为什么被…
语言·计算&LLM——3.一颗真正的CPU
前言 书接上回,我们用了将近五万字,从 D 触发器一路造到了乘法器。到上一篇结尾,你手里已经有了这么一堆东西:加法器、减法器、乘法器、移位寄存器、计数器、解码器、编码器。它们每一个都是从最底层的 NAND 门一层层搭起来的——这一点你一定要记住,后面我们反复会用到这个认知。 但现在的问题是:它们全是…
面向十亿级Token规模的超长文本处理架构研究报告:从长上下文LLM到图谱增强检索的深度解析
面向十亿级Token规模的超长文本处理架构研究报告:从长上下文LLM到图谱增强检索的深度解析 1. 执行摘要与核心论点 在当前生成式人工智能(Generative AI)技术的快速演进中,处理海量文本数据——特别是用户提出的“256万页书籍”(估算约为12.8亿Token)这一量级——已成为企业级应…
泸沽湖畔的唱与和:摩梭甲搓音乐与民歌的共生形态研究*
泸沽湖畔的唱与和:摩梭甲搓音乐与民歌的共生形态研究 导言:界定一个文化复合体 摩梭 (Mosuo) 文化以其独特的母系社会结构和“走婚” (Zouhun) 习俗而闻名于世 1。在这一社会框架内,音乐和舞蹈扮演着不可或缺的社会功能角色。其中,“甲搓” (Jiacuo) 舞蹈和“民歌” (Minge) …
活态象形文字的计算再生:纳西东巴文的计算机视觉处理、语义提取与技术前沿分析
活态象形文字的计算再生:纳西东巴文的计算机视觉处理、语义提取与技术前沿分析 I. 导论:数字人文视野下的“东巴文难题” 1.1. 纳西东巴文:作为文化遗产的价值与濒危现状 纳西东巴文是云南丽江纳西族的核心文化载体 1。它并非一种孤立的文字系统,而是围绕“东巴教”——一种原始宗教文化——构建的多元复杂…
深度技术评估报告:Dots.OCR 架构机制、微调可行性与生态系统全景分析
深度技术评估报告:Dots.OCR 架构机制、微调可行性与生态系统全景分析 1. 执行摘要与引言 在过去三十年中,光学字符识别(OCR)技术经历了几次根本性的范式转移。从早期的基于规则的匹配算法,到卷积神经网络(CNN)与循环神经网络(RNN)结合的CRNN架构,再到目前基于Transformer的…
Ubuntu快速开局
Ubuntu 服务器快速部署手册 本文档旨在记录一次完整的 Ubuntu 服务器重装和环境配置流程,适用于开发和深度学习等场景。 第 1 步:安装 NVIDIA 驱动与 CUDA 为了确保显卡驱动的稳定,推荐先禁用系统自带的 Nouveau 开源驱动,再安装 NVIDIA 官方驱动。 禁用 Nouv…
从历法到GIS:探索天地规律的技术演进与应用——经纬绘山河
注意 本文是教程,不是学术论文,也不是研究报告,所以语体会尽可能通俗易懂。 可能需要一定的电脑硬件以支持操作,建议16G内存+100G以上磁盘空间(问就是有时候数据量比较大)。 有问题欢迎随时讨论,毕竟是自己的经验。 我事先说明,很多东西可能不是新的东西,也许在哪都可能听到过,也许或多或少有人提过,…
亚文化与后亚文化研究(fromgemini)
亚文化与后亚文化研究 1. 引言:界定亚文化与后亚文化的领域 1.1 重要性概述 亚文化与后亚文化是理解社会分化、身份认同形成、文化抵抗以及社会规范演变的关键视角,尤其在青年群体中表现突出。它们不仅是边缘现象,更深刻反映并影响着广泛的社会、经济及政治潮流 1。对这些群体的研究,为我们洞察个体与集体如…
从Python到Go:借助AI构建高性能去重工具学习之旅(from gemini)
从Python到Go:借助AI构建高性能去重工具学习之旅 1. 引言:从Python到Go的性能跃迁之旅 1.1 欢迎与肯定 对于拥有两到三年Python开发经验的开发者而言,开启Go语言的学习之旅是一个明智的选择。已有的编程基础将为学习Go语言提供坚实的起点。本报告旨在引导您顺利从Python过渡…
评估在NVIDIA L40 GPU上解决VLLM NCCL P2P通信问题的方案:IOMMU与PCI ACS禁用的有效性、风险及替代策略(from gemini)
评估在NVIDIA L40 GPU上解决VLLM NCCL P2P通信问题的方案:IOMMU与PCI ACS禁用的有效性、风险及替代策略 I. 执行摘要 本报告旨在全面评估一项针对在NVIDIA L40 GPU系统上运行VLLM(大规模语言模型推理与服务库)时遇到的NCCL(NVIDIA Colle…
光学乐谱识别(OMR)系统的评测基准:数据集与指标分析(from gemini)
光学乐谱识别(OMR)系统的评测基准:数据集与指标分析 1. 引言 光学乐谱识别(Optical Music Recognition, OMR)是计算机视觉和模式识别领域的一个重要分支,其目标是自动将乐谱图像转换为机器可读的符号化格式,如 MusicXML 或 MEI 1。这项技术对于音乐文献的数字…
数字乐谱:光学乐谱识别软件与记谱格式深度解析(from gemini)
数字乐谱:光学乐谱识别软件与记谱格式深度解析 引言 背景设定 随着科技的飞速发展,音乐领域正经历着从传统纸质乐谱向数字化格式的深刻转变 1。这一转变不仅改变了音乐的创作、学习和演奏方式,也对乐谱的保存和传播提出了新的要求。在这一数字化浪潮中,两个核心需求应运而生:一是如何高效地将现存的大量纸质乐谱转…