开元棋牌官方网站 Anthropic最新发达, Claude仍是写公司80%的代码, AI运转自我进化

AI终于运转造我方了。

6月5日，Anthropic发布了一篇很不寻常的长文，题目叫When AI builds itself。直译过来便是，当AI运转建造我方。

这篇著述的中枢不雅点便是AI正在加快AI的发展。更进一步，若是这个趋势赓续走下去，改日可能出现一种系统：它八成自主遐想、开导、检会下一代AI。

这不是科幻演义里的奇点叙事。Anthropic拿出了大批里面数据，它想说明东说念主类正在把AI研发经过里的履行设施，少量点交给AI。况兼这个叮咛速率，比大多数东说念主联想得更快。

最惊东说念主的数字是，达成2026年5月，Anthropic代码库中越过80%的合并代码，仍是由Claude编写。2025年2月Claude Code发布联系预览版之前，这个比例还仅仅低个位数。

Anthropic不是一家普遍软件公司。它是全球最前沿的大模子公司之一。它的工程师，基本便是全球最懂AI系统的东说念主之一。当今，Claude正在给这些东说念主写代码，还在帮他们抓bug。

AI不是在外围打杂，AI仍是进厂了，进的如故制造下一代AI的工场。

Anthropic给出了一个很罕见念念的新绸缪。AI能孤苦完成的任务时长。

2024年3月，Claude Opus 3不错完成大要突出于东说念主类4分钟的软件任务。2025年，Claude Sonnet 3.7不错完成大要1.5小时的任务。2026年，Claude Opus 4.6不错处理12小时级别的任务。最新的Claude Mythos Preview在METR测试中，仍是能连气儿责任至少16小时，接近测试框架刻下能辩论的上限。

之前大要每7个月翻倍一次，当今造成大要每4个月翻倍一次。若是趋势赓续，本年AI可能投入东说念主类几天级任务区间。到2027年，AI可能运转处理东说念主类需要几周才能完成的复杂任务。

这才是这篇著述最让东说念主不安的场地。真确的变化是，AI能连气儿责任的期间越来越长。AI从一个聊天窗口，造成一个不错我方读代码、改代码、运行代码、调试失实、调用其他Agent互助的责任系统。

在昔时，东说念主类仍然掌抓标准。你告诉AI何如作念，它给你局部匡助。当今，东说念主类只需要给办法。Claude会我方想旅途。它不一定老是生效，但生遵守正在快速提高。

Anthropic把工程任务分红不同难度。最节略的是明确bug建造。更复杂的是灵通式问题。比如系统为什么变慢，检会任务为什么崩溃，某个绸缪为什么一会儿特殊。最难的是，连谜底长什么样都不细目。

在这类最灵通的任务上，Claude的生遵守在2026年5月达到76%，半年内提高了50个百分点。

发达里有一个案例。一次惯例升级导致数万个检会任务崩溃。工程师把Claude接入事故现场，只给了一些文本骨子和集群走访权限。Claude逐一排查运行中的任务，逐一测试环境成立，终末定位到一个相当荫藏的调试标记。它复现问题，阐明建造。扫数过程大要2小时。东说念主类通常需要2到3天。

这类案例说明，AI运转领有局部工程判断。它不错在杂乱系统里找萍踪，在大批落魄文中保持夺概念，在东说念主类不肯意作念、作念不动、作念得慢的场地无间鼓动。

2026美加墨世界杯中国官方网页版

是以，代码量暴增并不奇怪。Anthropic说，在2021到2024年，工程师每天合并的代码行数基本深刻。2025年Claude运转我方运行代码之后，弧线运转上扬。2026年模子能更耐久间自主责任后，弧线再次变陡。到2026年第二季度，典型工程师每天合并的代码量仍是是2024年的8倍。

固然，代码行数不是完满绸缪。更多代码不等于更多价值。它可能高估真实分娩率。但Anthropic还作念了职工侦探。2026年3月，130名联系团队职工的中位数揣度是，使用Mythos Preview后，我方的产出大要提高了4倍。

Claude不仅会写代码，它还会优化代码。

Anthropic每次发布新模子，都会作念一个固定测试。给Claude一段检会袖珍AI模子的代码，让它在保证后果正确的前提下，把运行速率优化到最快。这个任务很像微型AI联系轮回。目表明确，绸缪明确，剩下便是不断改代码、运行、计时、复盘、再试。

2025年5月，Claude Opus 4平均不错把代码加快约3倍。2026年4月，Claude Mythos Preview作念到了约52倍。当作参照，一个纯熟的东说念主类联系员通常需要4到8小时才能作念到4倍把握。

Claude在明确界说的实验履行设施上，运转越过东说念主类联系员。

更进一步，Anthropic还展示了Claude端到端运行灵通联系款式的才气。它给Claude Agent一个AI安全问题，轻视是弱模子能否可靠监督强模子。Agent需要我方刻薄假定，测试假定，与并行Agent共享发现，不断迭代。

两名东说念主类联系员花了大要1周期间，把性能差距松开了约23%。Claude Agents累计运行约800小时，耗尽约1.8万好意思元算力，把差距松开了97%。

这项实验还有禁止。后果莫得实足迁徙到分娩领域模子。问题本人和评分圭臬仍然由东说念主类设定。但在这个鸿沟内，Claude我方遐想了每一个实验。东说念主类真确作念的事情，是定标的。

东说念主类从履行者，造成带领者。再从带领者，造成审核者。再从审核者，造成监督一整套AI系统的东说念主。

当今，Anthropic里面的代码变更，仍是会先经过自动化Claude审查器。它厚爱找bug、安全弊端和其他弱势。Anthropic回溯分析发现，若是昔时每次代码变更都有这说念自动审查，大要三分之一导致claude.ai线上事故的bug，开元棋牌2026世界杯(中国)官网原来不错在上线前被拦下。

Claude写代码，Claude审代码，Claude抓东说念主类错过的问题。下一步很当然，Claude审Claude写的代码。再下一步，Claude遐想让Claude变得更强的实验。

这便是递归自我改造的雏形。

Anthropic很严慎。它反复强调，完整递归自我改造还莫得发生，也不一定势必发生。今天的Claude仍然有短板。尤其是联系试吃和判断力。什么问题值得作念，什么标的有出路，什么后果实在，什么时候应该毁灭一条路子，这些仍然是东说念主类的相比上风。

但最危急的问题也在这里。咱们凭什么细目联系试吃不会被AI攻克？

昔时几年，好多才气都资格过访佛弧线。最先，人人说AI不懂幽默、不懂情怀、不懂复杂推理、不懂真实天下。然后某一天，它一会儿就会了。联系试吃可能亦然这么。它也许不是隐讳才气。它可能仅仅弥散多实验、弥散多反映、弥散长落魄文、弥散强用具调用之后显现出来的判断函数。

即使AI长期莫得顶级联系试吃，天下也会被转换。因为履行本钱仍是被大幅压低。东说念主类只好作念5%的标的遴选，AI处理剩下95%的履行责任，每个联系员能转换的责任量就会远越昔时。

这会重塑公司。一个100东说念主的团队，不错作念昔时1000东说念主的事，改日甚而可能作念1万东说念主、10万东说念主的事。常识责任的领域经济会被再行界说。公司不再只靠招东说念主彭胀，而是靠每个东说念主底下挂若干Agent，靠组织能不可快速发现瓶颈，能不可把新瓶颈赓续自动化。

Anthropic提到了阿姆达尔定律。一个经过的总速率，受限于莫得被加快的部分。代码写快了，代码审查造成瓶颈。实验跑快了，判断哪些实验值得跑造成瓶颈。想法爆炸了，组织消化才气造成瓶颈。

这会带来一种相当奇怪的新天下。AI让每个东说念主都变强，但组织不一定坐窝变聪惠。分娩力爆炸，惩处才气可能跟不上。想法越来越多，夺概念越来越稀缺。履行越来越低廉，判断越来越不菲。

对东说念主类来说，这既是弘大契机，亦然弘大风险。

医学、材料、动力、软件安全、基础科学，都可能被AI科研系统加快。若是AI能帮咱们更快跑实验、更快发现药物靶点、更快遐想材料、更快找出系统弊端，东说念主类社会会获取弘大的技巧红利。

Anthropic提到Project Glasswing。Mythos Preview在上线前几周，就在全球病笃系统中发现越过1万个高危和严重级软件弊端。昔时汇注安全的瓶颈是找不到弊端，当今可能造成补不外来。

这很像改日科学立异的缩影。昔时瓶颈是发现，以后瓶颈可能造成考据、部署、监管和社会汲取。AI实验室不错跑得像火箭，但东说念主类社会仍然有病院审批、药物临床、法律模范、伦理争议、选举周期、讲授系统、家庭相关。这些东西不会因为算力提高就立即销毁。

是以，AI与东说念主类的改日不会是通宵之间全部翻篇。更可能是一种扯破。上游研发以算力速率决骤。下流社会以轨制速率、体魄速率、信任速率缓缓消化。

风险也相通彰着。若是AI的确能我方构建下一代AI，对皆问题会被放大。今天模子里偶尔出现的区分皆、独揽、办法偏移、用具销耗，在自我迭代过程中可能不断累积。每一代系统都更强，也更难贯穿。到某个节点，东说念主类可能仍是看不懂它为什么这么作念，也追不上它迭代的速率。

这便是Anthropic终末命令减慢甚而暂停前沿AI开导的原因。

真确有好奇的暂停，必须是多个国度、多个资源充足的前沿实验室，在归拢要求下可考据地减慢或住手。人人必须能阐明别东说念主莫得暗暗赓续检会。也必须界说明晰，什么要求触发暂停，什么要求拆除暂停，由谁裁决。

这听起来很逸想化，也很坚苦。检会大模子不像导弹放射井那么容易监控。算力、数据、电力、芯片都是通用资源。暗暗检会的激发相当强。谁在别东说念主暂停时赓续前进，谁就可能采纳当先上风。

但Anthropic至少刻薄了一个病笃判断。AI发展速率仍是快到不可只靠公司自律，社会需要一种可操作的刹车机制。刹车不一定赶紧踩下去，但必须先造出来。不然真到需要刹车的时候，可能仍是莫得标的盘了。

我以为，这篇著述真刚巧得眷注的是，东说念主类服务的中枢界说正在变化。

当今履行被外包以后，办法本人也在被压缩成更少数东说念主的才气。会判断的东说念主，价值飞腾。不会判断的东说念主，仅仅把我方的操作才气交出去，然后发现我方不再贯穿系统。

爱迪生说，天才是1%灵感加99%汗水。当今99%的汗水正在被自动化。但灵感并不老是假造出现。好多判断力，恰是从耐久亲手试错、耐久被系统折磨、耐久在失败里积贮出来的。

若是一个东说念主从不写代码，从不跑实验，从不排查崩溃，从不资格脏活累活，他改日还能不可领有真确的判断力？这可能是AI时间最被低估的问题。

AI与东说念主类的改日，最佳的形态不该是东说念主类透澈毁灭履行，然后只作念贫窭的引诱。真确强的东说念主类，应该学会和AI扫数扩大履行半径，同期保留对枢纽过程的贯穿才气。你不错不亲手敲每一排代码，但你必应知说念系统为什么这么责任。你不错让AI跑100个实验，但你必应知说念哪些后果值得信，哪些后果仅仅漂亮杂音。

Anthropic这篇著述深层讲的是，东说念主类如安在一个自我加快的智能系统把握，保住我方的位置。

标的盘还在东说念主类手里。但手仍是运转发抖。更准确地说，标的盘也许还在，仅仅车速仍是越来越不像东说念主类遐想说念路时联想的速率。

若是AI的确运转建造我方开元棋牌官方网站，东说念主类最病笃的任务就不再是说明我方比AI聪惠。那很可能是一场必输的比赛。东说念主类更病笃的任务，是决定什么样的智能值得被建造，什么样的改日仍然配得上被称为东说念主类的改日。