DeepSRT X 動態摘要

Chubby（@kimmonismus）抓住官方公告裡「我們的下一個主要模型」這句措辭，推論那個解開十個長期未解問題的內部模型確實就是下一代旗艦；一句用詞就把整件事的定位確認了。（2084358513678020856）

小互（@xiaohu）詳細說明某實驗室突然放出一份公告與一份兩百多頁的論文，說其下一代主力模型的一個內部版本解開了十個數學與理論計算機科學的老問題，而那不是十道競賽題——最老的一個一九六四年提出、最年輕的也躺了二十多年；「最老的來自一九六四年」是最關鍵的補充事實。（2084088697411244464）

Forward Future Brian（@ForwardEditor）指出關於那個下一代模型的傳言到處飛，所以他做了一個專門追蹤模型傳言的網站；傳言追蹤器本身就是這一波節奏的產物。（2084343791234736358）

Polymarket（@Polymarket）快訊指出某公司的新高階模型被預測會在兩週內釋出，機率百分之八十二；預測市場的機率應與官方時程分開看。（2084329403836768371）

Alibaba Group（@AlibabaGroup）官方介紹其新旗艦，稱之為至今最大且最有能力的旗艦模型，具備兩兆四千億參數與一百萬 token 的上下文視窗，是為進階某某而設計；集團層級的官方發布補上了規格細節。（2084102898796105964）

Alibaba Cloud（@alibaba_cloud）用一句廣告語定位那個旗艦是你隨時在線的同事，涵蓋寫程式、推理、研究、寫作與 AI 代理，並說「你過你的生活，它做工作」，附上其平台的試用連結；「你過你的生活」是相當大膽的宣告。（2084110324429738016）

Unsloth AI（@UnslothAI）指出那個二百七十億參數的模型要來了，而它將能在十七 GB 記憶體或顯示記憶體的配置上本地運行；十七 GB 這個門檻讓它進入了消費級硬體的範圍。（2084110664789024769）

Qwen（@Alibaba_Qwen）另貼出其模型效能的英文版圖表；官方評測圖表應與第三方排行榜對照閱讀。（2084113977236475972）

Max For AI（@MaxForAI）驚訝發現那個旗艦的官方第一個案例居然是「連續十二小時設計芯片」，並反問兩家晶片公司看到了嗎；把官方案例的選擇當成戰略訊號來讀相當敏銳。（2084164832203600253）

himanshu（@himanshustwts）引述同一件事「某模型正在不停地設計晶片十二小時」，並說這是一個徵兆；同一個案例在兩個語圈同時被視為訊號。（2084148681612427426）

Bindu Reddy（@bindureddy）強烈反駁說某快速模型在某兩個模型之下、而且絕對不是前沿模型，因為在這個平台上有很多關於它是頂級模型等級的炒作，但它絕對不是；在一片好評中出現的反對意見值得認真對待。（2084355533658874302）

Cline（@cline）表示有人問為什麼他們的工具搭配開放權重模型比其他 harness 更好，所以他們想分享一些細節、更多內容在部落格，並說他們內部的某某；harness 與模型的適配細節是本週最有價值的技術內容。（2084359007029141528）

Jukan（@jukan05）分析為什麼開源的崛起與封閉模型壟斷的崩解對雲端有利，說壓在雲端產業身上最大的擔憂一直是某某；從雲端業者角度看開源浪潮是少見的視角。（2084305124252582049）

Sakana AI（@SakanaAILabs）推出其日語風格的大模型介面，說今天他們推出該模型的升級版、現在可以用介面呼叫；區域語言特化模型的介面化正在加速。（2084276852143919470）

lidang（@lidangzzz）重申地球上所有古典科技大廠都不可能長期保持在訓練第一梯隊生產用寫程式模型的位置，包括兩國最頭部的那幾家，因為一個能持續訓練第一梯隊模型的公司必須在市場上搶人、必須一切模型優先、必須把公司預期下一輪融資估值的三成分給員工；把組織條件量化成「三成估值」相當具體。（2084258582602690776）

Naveed Taheri（@naviidtaheri）認為重點不是那個模型、而是那個代理，並說如果你是開發者不要錯過它；把功勞歸給 harness 而非模型是本週反覆出現的觀點。（2084264380686832075）

Rohit（@rohit4verse）主張你的代理不需要圖、它需要一個沒有同時兼五份工的驗證器，並指出一個迴圈本身就已經是一張圖（一個節點、一條指回自己的邊），而你加上一個節點時某某；這是對「圖 vs 迴圈」熱潮最清醒的降溫。（2084325911659413653）

Yarchi（@undefinedKi）指出某公司剛公布了他們內部如何跑評測，而那讀起來像是一份 AI 工程師的職務說明：三層架構，先是程式化檢查、第二層是模型評審、然後某某；「三層」的具體結構比抽象的評測建議有用得多。（2084279627204235703）

codila（@0xCodila）指出某實驗室以年薪二十二萬到六十萬美元僱用一位工程師，因為他能為圖建造會自我改進的技能，並引述對話裡的一句「在我們公司我們團隊維護著一組這樣的某某」；把薪資區間與具體技能綁在一起，這是最實在的職能訊號。（2084336322194415682）

Florian.C（@FinnTsai88）指出個人代理很好做、公司代理才是地獄難度，因為權限邊界、記憶歸屬、技能如何變成組織資產、失敗後誰接管，這些才是真正卡住落地的地方，並說某加速器自己用其內部代理跑財務、法務、工程、還拿它開發自己，已經是最好的實踐樣本；這四個問題是本輪最完整的落地檢查清單。（2084083326923817183）

Shubham Saboo（@Saboo_Shubham_）分享某公司如何建造、測試與擴展代理技能，並附上其開源技能儲存庫的連結；大廠把技能工程流程開源是很好的參考素材。（2084343083953717518）

Amto（@XAMTO_AI）整理一套完整的代理設計模式學習材料，共四百二十四頁的 PDF 加上配套的互動筆記本，涵蓋提示鏈、路由、平行化這些基礎模式，也有反思、工具使用、規劃、多代理這些進階內容，還有檢索增強、護欄、人類在環這種實際落地的部分；一份完整教材的出現通常代表領域開始定型。（2084050863186928018）

Roan（@RohOnChain）建議不要花兩年學怎麼建造會自我改進的 AI 代理，因為某大學剛放出一堂三小時、從零開始建造 AI 代理的課程、並列出章節時間軸；免費的完整課程對這個領域的門檻下降幫助很大。（2084349908287635939）

GitHub AI Projects Community（@trendtech33566）介紹一個開源專案，定位是「能追溯 AI 判斷理由的基盤」、約兩千顆星，功能是匯入企業資料建構情境圖與知識圖、用圖分析與因果推論支援決策、並留下判斷的根據與歷史讓稽核容易；把可稽核性做成產品是本週的重要主題。（2084217776865259603）

Salesforce（@salesforce）宣布兩個聊天產品現在能安全地存取你的客戶關係管理資料，說他們正在改變你與銷售管線互動的方式，因為當你的系統變成無頭的之後就能某某；企業資料被代理直接存取，權限設計是關鍵。（2084309394389385265）

Jeff Teper（@jeffteper）宣布其代理建造平台的新版本今天正式上線，帶有某個寫程式代理的 harness、更快的設計器、改進的企業智慧支援，以及更多用來建造更強大代理與工作流程的東西；把外部 harness 收進自家平台是有意思的整合。（2084356298578219043）

Jeff Teper（@jeffteper）另在該版本上線的同時分享他對工作、應用與代理的未來的想法；平台負責人的框架宣告值得對照後續產品走向。（2084360312518832451）

Google Cloud Tech（@GoogleCloudTech）指出其代理執行環境最近啟用了一項功能，讓你能出貨一個代理的新版本而不必重新部署整個東西，同一個執行引擎、同一個網址；不必重新部署對代理的迭代速度影響很大。（2084355726630158626）

NVIDIA Robotics（@NVIDIARobotics）指出用代理技能能更快建造機器人應用，並邀請大家參加其線上時段，探索兩個模擬平台的代理工作流程如何自動化重複的某某；技能抽象擴散到機器人領域是值得注意的擴張。（2084349687042056340）

LangChain（@LangChain）引述一句「我在某公司的職涯分成某個系統之前與之後」，並指出該公司用某種代理框架、在一週內、只用一位工程師就建出了他們的知識 AI 平台；一週一人的內部平台是很硬的生產力證據。（2084353609115009531）

Dan Schwarz（@dschwarz26）宣稱 AI 預測現在大致上已經超越人類，而今天他們的預測公司退出公開測試、向所有人開放，並說那是最早的 AI 預測某某；「超越人類」的宣稱應該用可驗證的追蹤紀錄來檢驗。（2084314959065059499）

Ben（@SolidlySheafy）宣布其專案正式上線，說背後的動機是有些模型就是不想學，而大多數優化器基準問的是你能多快訓練一個給定的某某；把問題重新框定為「模型的可訓練性」相當有意思。（2084339800828695015）

David Ball（@davieball）宣布推出基因體智慧產品，說你能用最新的 AI 模型探索你的基因體、而不必把基因體交給它們，並列出功能包括探索血液某某；「不必把資料交出去」是這一波產品最值得推廣的設計原則。（2084143084519276774）

Wes（@wesbillman）發布其桌面代理應用的新版本，內容包括更可靠的代理設定、導覽、群組通話、已封存的討論串與共享算力，加上一條給遠端代理用的早期容器編排部署路徑；共享算力被列為功能說明本地資源正在被池化。（2084344750719770995）

herdr（@herdrdev）發布其專案的新版本，說這是第一個採用該開源授權的版本，不是功能豐富的一版、而是為接下來鋪基礎，包含五十五個修正、十八位貢獻者、以及最大的某某；授權變更通常比功能更新影響更深遠。（2084361182983463205）

The Graph（@graphprotocol）指出新的子圖部署會把大量同步時間花在等待資料庫建立還沒有人查詢的索引上，而其新版本把那件工作移出關鍵路徑；把「還沒人查詢的索引」延後是很聰明的優化。（2084350383996977598）

智享（@CycleDecoded）介紹某交易平台自研的輕量前端圖表庫，說體積只有約三十五 KB（比一張動圖還小）但效能極其恐怖，已有一萬六千多顆星、採用寬鬆開源授權，套上資料介面就能直接造一個同類產品；三十五 KB 這個體積在前端膨脹的年代格外突出。（2084245765531345038）

freeCodeCamp.org（@freeCodeCamp）指出 AI 代理能做的不只是回答問題，它們能規劃、做決策、並自動化多步驟的工作流程，而在這支深入的教學影片裡你會學到如何建造某某；把代理的能力邊界講清楚對初學者很重要。（2084309059851690157）

Daniel San（@dani_avila7）更新了他的速查表，整理某代理的工作階段指令以及各自該在什麼時候用，並說他幾天前在更新日誌裡看到那個分叉指令被改名、現在的命名好多了；速查表的維護在指令快速變動時很有價值。（2084343390624211099）

divyansh tiwari（@DivyanshT91162）列出十個好到不該免費的開源儲存庫，第一個是一個路由專案，特色是一個端點、兩百三十一個 AI 供應商、五十多個免費層級的供應商；兩百三十一個供應商說明這個市場有多碎裂。（2084011101675511819）

そう（@so_ainsight）整理本週某平台上趨勢排名前十的 AI 儲存庫，第一名是一個給寫程式代理用的技能集合，裡面包含日常開發的實用工具；趨勢榜的組成正在被技能專案主導。（2084114545690423407）

Filip（@Neriousy）詢問大家會不會對某個開源代理的行動裝置版本有興趣；行動端代理是目前明顯的空缺。（2084281398832058810）

Kiro（@kirodotdev）用一句「誰準備好迎接明天了」預告某件事；預告型貼文的資訊量低但時間點值得記錄。（2084355692438147158）

Armin Ronacher（@mitsuhiko）用「必讀」兩個字推薦一篇文章並附上連結；來自資深開源作者的極簡推薦通常值得點開。（2084308544224985527）

Theo（@theo）表示某個第二版看起來是巨大的改進、他很期待它發布；期待值宣告在發布密集期也是一種訊號。（2084347156996231442）

Wise（@trikcode）表示他把某個路由服務的金鑰放進某個編輯器、把每日上限設成五美元，而他連續寫了三天程式、總帳單是零點八四美元；把訂閱與按量計費的成本差距講得這麼具體，這是本輪最有用的一筆帳。（2084351118499369231）

Yosuke Furukawa（@yosuke_furukawa）表示他根據一本重構的書、實際用兩個 AI 工具重構了一個服務，把十五萬行程式碼換成另外兩種語言，而實際的 token 用量某某；十五萬行的實際案例比任何示範都有說服力。（2084190690041598347）

Andrew Wilkinson（@awilkinson）向某實驗室執行長反映他很愛某個代理、但有一個非常笨又細微的問題：另一個代理「感覺上」更快，而他認為主要原因是後者在做每一件事的時候會立刻某某；體感速度與實際速度的落差是很重要的產品洞察。（2084296496628015153）

Casey Muratori（@cmuratori）指出原討論者之所以能「停止看組合語言」，唯一的原因是還有一群其他人在看，因為編譯器的產碼錯誤一直都在發生、但原討論者從來沒某某；這是對昨天那個「原始碼變成組合語言」說法最有力的反駁。（2084346595685138501）

Beto（@betomoedano）主張軟體工程的核心沒有改變、它仍然難學、仍然要花好幾年，而改變的是你現在可以在不理解某某的情況下生產出軟體；把「能生產」與「能理解」分開是很清楚的診斷。（2084311611167191471）

levelsio（@levelsio）表示他每個月付很多錢的會計師，剛剛用一個百分之百由 AI 生成的回覆回答了他的問題並解釋了某件事，不過那個答案確實有幫助、所以他本來也可以某某；專業服務的價值重估正在從這種小事開始。（2084348044808507416）

Brian Armstrong（@brian_armstrong）承認如同有些人猜到的，那篇文章是由 AI 寫的、他只給了最少的提示，並問知道它是 AI 寫的之後，你會更喜歡它、更不喜歡它、還是沒有改變；把揭露當成實驗來做相當坦誠。（2084077150836232521）

cvxv666（@antpalkin）引述某對沖基金執行長說「看著 AI 在幾個小時內完成一週的博士級工作，我相當沮喪」，並補充他身價五百一十二億美元、且該國每筆股票交易的兩成某某；來自受益最大者的沮喪相當值得記錄。（2084348000864809147）

Dr. Parik Patel（@ParikPatelCFA）調侃一個付四十萬美元僱活動經理的人，居然對人們是為了錢而不是使命加入他的公司感到意外；把使命論的爭議用一句話拆掉。（2084302657234329731）

Corey Chiu（@realcoreychiu）表示週末路由器壞了、換了新的、測速很快但看影片每隔幾十秒就要緩衝一次，而他用某模型幫忙診斷並優化、效果立竿見影、調整後影片播放非常流暢、打遊戲也一點都不卡，並順手把整個流程做成一個開源某某；把一次個人排錯變成開源工具是很好的習慣。（2084140722131800218）

QingYue（@YuLin807）表示因為同時使用語音輸入法之後、用某代理並行非常多的項目，讓他的腦力已經不太跟得上，所以他打算對他的代理標準流程技能進行二度優化，主要是為了把各個工作階段裡的東西統一規劃起來、有一個類似看板的東西；「人腦跟不上並行度」是很真實的新瓶頸。（2084284613254684834）

QingYue（@YuLin807）另發現某代理可以跨工作階段進行交流；跨階段通訊的可行性對工作流程設計影響很大。（2084288058430787666）

meng shao（@shao__meng）指出最近幾個月的面試中，候選人離職比例最高的原因是「組織架構調整」、俗稱裁員，而這在該國網路業特別是大廠最普遍，此外還有一類原因是負責人離職後新人帶了自己的人來、自己被邊緣化；招募端的第一手觀察比總量統計更具體。（2084256535849435508）

seb（@hiiinternet）指出在過去四週裡，一百六十八位工程師透過某平台從新創公司收到四百七十七個面試邀約，平均出價二十萬三千美元、最高三十五萬美元（都是底薪）；具體的薪資分布在就業焦慮的一週特別有價值。（2074201419104563448）

Y Combinator（@ycombinator）主張學 AI 最好的方式是在一家 AI 新創工作，並宣布八月十五日邀請有企圖心的學生到總部見五十多家旗下公司的創辦人與工程師；把招募活動包裝成學習路徑相當有效。（2084332089881862656）

nisarga（@ni5arga）問為什麼人們還是執著於資料結構演算法與競賽平台，好像那是衡量工程能力的唯一標準；能力評估標準的過時是就業市場摩擦的來源之一。（2084307547251683551）

Xiuyu Li（@sheriyuo）觀察到反人類的想法或是毫不相關的兩個東西相加，總是能做出一些驚人的工作，而被時間檢驗的工作總是大道至簡的；研究品味的這個對照相當精準。（2084254071209558038）

swyx（@swyx）用一句「哈哈我們到底還在這裡幹什麼啊各位」表達無力；在發布密度極高的一天，這種反應本身就是新聞。（2084185368950456421）

Vivek Galatage（@vivekgalatage）指出車內推論對汽車業來說是相當有意思的工程挑戰，因為除了機械與電子這些傳統限制之外，車內的 AI 推論還某某；邊緣推論的實體限制很少被軟體圈討論。（2084076194954404057）

Vincent Yang（@m1ssuo）表示他的服務現在跑在某地的一台伺服器上、由某供應商贊助，現在訪問速度極快、比原來提升了數十倍，而那家供應商有三網優化、到某地延遲最低不到三十毫秒；網路延遲的地理現實對亞洲開發者很重要。（2084184482152939901）

Jiahan Chen（@jiahan_c）指出某個影片程式庫現在對新專案預設啟用另一個打包工具；預設值的變更往往比新功能更影響生態。（2084242304228041203）

Ahmed Dahbi（@dahbiahmed）表示他的個人網站現在有一張會跟著你的游標的臉、還有一個你可以把書抽出來旋轉的三維書架，並說這些完全都不必要；不必要的東西正在變便宜，這本身就是一個現象。（2084346264326451289）

Kit Langton（@kitlangton）拜託有人阻止他購買某個裝置；硬體衝動在本地推論熱潮中相當普遍。（2084352430452412462）

deepfates（@deepfates）看到一份美國最幸福城市的研究把某個郊區城市排在第一，並說如果你的方法論把你帶到了這個結論，那你的方法論還有什麼用；用結論的荒謬反推方法論的問題相當有效。（2084330903900451250）

Adrien Brochier Allari（@AdrienBrochier）用對比諷刺：某個經濟體說「我們絕對必須減速並監管 AI 讓它更合乎倫理與環保」，而另一個經濟體說「這是一個裝在壓縮檔裡、可以安裝在你的輕薄筆電上的半神」；把監管節奏與發布節奏並置最能說明張力。（2084258738437767403）

TravelGov（@TravelGov）通報某國在八月二日晚間某個時刻因為電網崩潰而經歷了全國性大停電，而根據該國官方媒體的說法，原因是某某；全國電網崩潰是重大的基礎設施事件。（2084336496979722501）

Bloomberg（@business）報導某國上個月變成完全依賴另一國的液化天然氣進口，因為中東的戰爭導致對歐洲的供應驟減；能源依賴的快速反轉是戰爭最直接的經濟後果。（2084348600662860096）

Bloomberg（@business）另報導某創投領投了某核能新創的十億美元募資，而該公司說那將幫助它從示範小型反應爐轉向量產；「從示範到量產」是核能新創的關鍵門檻。（2084352374278111723）

Watcher.Guru（@WatcherGuru）報導某位領導人說兩家石油公司因為某場戰爭造成的高油價「賺太多錢了」，並說「我不喜歡這樣」；同一位領導人幾小時前才要求業者降價，兩則放在一起讀更完整。（2084352507405312023）

CNN Breaking News（@cnnbrk）報導某位領導人正在考慮撤換某地區的聯邦檢察官，起因是司法部得出的一個結論、指某案件存在問題；人事變動的司法獨立性影響值得追蹤。（2084354574907781180）

The New York Times（@nytimes）引述其社論版的論點：「某國政府並不持有製藥公司的股份。它不持有航空公司、石油公司或肉品加工商的股份」；社論的立場應與新聞報導分開閱讀。（2084361180999569848）

Palantir（@PalantirTech）用「擁有生產工具，跟我們一起起義」這樣的口號發文；一家防務資料公司使用這種修辭本身就值得記錄。（2084355536732967201）

Hayden Adams（@haydenzadams）指出其協議的第三版最初被看衰是因為人們不理解某種流動性設計，而現在那種設計已佔鏈上交易的多數，至於第四版最初被看衰是因為某某；「最初被看衰」的模式重複出現有其參考價值。（2084352738037510596）

CZ（@cz_binance）調侃銀行是有可能倒閉的、那個詞就是從那裡來的，並說他還是偏好加密資產；詞源笑話包裝的立場宣示。（2084326153582706891）

0xSero（@0xSero）尋找有興趣幫他們處理某個本地 AI 專案上線日的人，說如果你想參與就告訴他、很快就要來了；本地推論工具的社群化值得留意。（2084351011880374596）

> 昨天那條數學爭議在這一小時被兩則貼文釘死了。@kimmonismus 抓住官方措辭「我們的下一個主要模型」，推論**那個解開十個難題的內部模型就是下一代旗艦**；而 @xiaohu 補上最關鍵的事實：那份公告附帶**一份兩百多頁的論文**，而且那不是十道競賽題——**最老的問題一九六四年提出，最年輕的也躺了二十多年。**

Qwen 這邊由集團與雲端部門雙線官方確認規格（**2.4T 參數、1M 上下文**），而最實際的門檻來自 @UnslothAI：**27B 版本將能在 17GB 記憶體的配置上本地運行。** 官方案例的選擇也被 @MaxForAI 讀成戰略訊號：**第一個案例是「連續 12 小時設計芯片」。** 同時 @bindureddy 提出了必要的反對意見：**DeepSeek Flash 絕對不是前沿模型**，那些「Fable 等級」的說法是炒作。

方法論上出現本週對「圖」熱潮最清醒的降溫（@rohit4verse）：**「你的代理不需要圖，它需要一個沒有同時兼五份工的驗證器——一個迴圈本身就已經是一張圖。」** 而 @undefinedKi 找到了具體參考：**Airbnb 公布的內部評測是三層架構——先程式化檢查、再模型評審**。企業落地的難點則被 @FinnTsai88 列成完整清單：**權限邊界、記憶歸屬、技能如何變成組織資產、失敗後誰接管。**

成本面有本輪最有用的一筆帳（@trikcode）：**把 OpenRouter 金鑰放進 Cursor、日上限設 5 美元，連續寫三天程式總帳單 0.84 美元。** 而 @yosuke_furukawa 給了規模端的實例：**用 AI 工具把 15 萬行程式碼重構掉。**

@cmuratori 則對昨天「原始碼會變成組合語言」的說法做了最有力的反駁：**你之所以能「停止看組合語言」，唯一的原因是還有一群其他人在看——編譯器的產碼錯誤一直都在發生。**

最後一則來自受益最大者的沮喪（@antpalkin 引述 Ken Griffin）：**「看著 AI 在幾個小時內完成一週的博士級工作，我相當沮喪。」**