国产毛片精品,精品国产综合成人亚洲区,中文字幕在线看日本大片

讓AI像人類一樣操作電腦！Anthropic上新Claude 3.5 Sonnet模型新能力快訊

TechWeb.com.cn 2024-10-23 15:42

分享到：

導讀

Anthropic于2023年3月發布了Claude 3系列模型Claude 3 Haiku、Claude 3 Sonnet、 Claude 3 Opus，Claude 3.5 Sonnet目前使用計算機的能力并不完美，開發人員可以指導Claude使用計算機。

【TechWeb】10月23日消息，OpenAI競爭對手Anthropic宣布推出升級版的Claude 3.5 Sonnet和新款Claude 3.5 Haiku。

根據Anthropic介紹，升級版Claude 3.5 Sonnet獲得了一項革命性的新技能：能夠像人類一樣操作電腦。同時，升級版Claude 3.5 Sonnet模型各項能力均超越之前版本，尤其在代碼方面取得了特別顯著的進步，進一步鞏固其行業領先地位。

新款Claude 3.5 Haiku則在許多評估中與Anthropic之前最大的型號Claude 3 Opus的性能相匹配，其成本和速度與上一代Haiku相同。

升級后的Claude 3.5 Sonnet現在可供所有用戶使用。從今天開始，開發者可以在Anthropic API、Amazon Bedrock和Google Cloud的Vertex AI上使用計算機測試版進行構建。新的Claude 3.5 Haiku將于本月晚些時候發布。

升級版Claude 3.5 Sonnet：超強編碼能力，公測“計算機使用”功能

據介紹，升級版Claude 3.5 Sonnet在業界基準測試中表現卓越，在SWE-bench Verified編碼測試的得分由33%躍升至49%，超越所有目前公開可用的模型。在TAU-bench（評估模型靈活運用工具和API綜合能力的基準測試）中，其零售領域得分從62.6%提高到69.2%，航空領域從36.0%提高到46.0%。性能全面提升的同時，Claude 3.5 Sonnet的成本與之前版本保持一致。

另外，Anthropic早期的客戶反饋表明，升級后的Claude 3.5 Sonnet代表了人工智能編碼的重大飛躍。GitLab測試了DevSecOps任務的模型，發現它提供了更強的推理能力（跨用例高達10%），沒有增加延遲，使其成為支持多步驟軟件開發過程的理想選擇。

同時，Anthropic在Claude 3.5 Sonnet公測版中引入了一項突破性的新功能：計算機使用。通過API接入，開發人員可以指導Claude使用計算機，就像人們看屏幕、移動光標、單擊按鈕和輸入文本一樣。

Anthropic表示，Claude 3.5 Sonnet是第一個在公測中提供“計算機使用”的AI模型。該功能現階段是實驗性的，預計隨著時間的推移，這種能力會迅速提高。

Anthropic介紹，在“計算機使用”能力上，沒有制作特定的工具來幫助Claude完成個人任務，而是教它一般的計算機技能，讓它能夠使用為人類設計的各種標準工具和軟件程序。開發人員可以使用這個新興功能來自動化重復流程，構建和測試軟件，并執行研究等開放式任務。

Anthropic構建了一個API，允許Claude感知計算機界面并與之交互。開發人員可以集成此API，使Claude能夠將指令（例如，“使用我的計算機和在線數據填寫此表單”）轉換為計算機命令（例如，檢查電子表格；移動光標打開web瀏覽器；導航到相關網頁；使用這些網頁中的數據填寫表單等等）。

效果方面，在評估人工智能模型像人一樣使用計算機的能力的OSWorld上，Claude 3.5 Sonnet在屏幕截圖（screenshot-only）類別中的得分為14.9%，明顯高于次佳人工智能系統的7.8%。當提供更多步驟來完成任務時，Claude的得分為22.0%。

不過Anthropic也強調，Claude 3.5 Sonnet目前使用計算機的能力并不完美。人們毫不費力地執行的一些操作——滾動、拖動、縮放——目前給都Claude帶來了挑戰，鼓勵開發人員從低風險任務開始探索。

據悉，Asana、Canva、Cognition、DoorDash、Replit和瀏覽器公司已經開始探索這些功能，執行需要幾十個甚至幾百個步驟才能完成的任務。例如，Replit正在使用Claude 3.5 Sonnet的“計算機使用”和UI導航功能來開發一個關鍵功能，該功能在為Replit Agent產品構建應用程序時對其進行評估。

下面是Claude 最新演示的 AI 操作電腦的視頻截圖

在這個演示中，Claude瀏覽了不同的標簽頁，收集了所需信息，并填寫了一個表單，所有電腦操作均由Claude生成。

Claude 3.5 Haiku：最快速模型

新推出的Claude 3.5 Haiku是Anthropic下一代速度最快的模型。在與Claude 3 Haiku相同的成本和相似的速度下，Claude 3.5 Haiku在每個技能集上都有所提高，甚至在許多智能基準上超過了Anthropic上一代最大的型號Claude 3 Opus。

Claude 3.5 Haiku在編碼任務上表現得尤為出色。例如，它在SWE bench Verified上的得分為40.6%，超過初代版Claude 3.5 Sonnet和GPT-4o。

憑借低延遲、改進的指令遵循和更準確的工具使用，Claude 3.5 Haiku非常適合面向用戶的產品、專門的子代理任務，以及從大量數據（如購買歷史、定價或庫存記錄）中生成個性化體驗。

Anthropic介紹，Claude 3.5 Haiku將于本月晚些時候提供，并隨后提供圖像輸入能力。

Anthropic是由前OpenAI員工創立的公司，亞馬遜是Anthropic的重要投資者。今年3月，亞馬遜宣布已完成對 Anthropic 的 40 億美元投資，以深化推進生成式 AI 技術的發展。

Anthropic于2023年3月發布了Claude 3系列模型Claude 3 Haiku、Claude 3 Sonnet、 Claude 3 Opus，此后便按照各型號進行能力升級迭代。今年6月，Anthropic發布最強大模型Claude 3.5 Sonnet，擁有相比前代模型2倍的推理速度和1/5的調用成本。（果青）

Claude Anthropic Sonnet 使用計算機

分享到：

1.TMT觀察網遵循行業規范，任何轉載的稿件都會明確標注作者和來源；
2.TMT觀察網的原創文章，請轉載時務必注明文章作者和"來源：TMT觀察網"，不尊重原創的行為TMT觀察網或將追究責任；
3.作者投稿可能會經TMT觀察網編輯修改或補充。

麻豆国内精品欧美在线-麻豆国内精品久久久久久-麻豆国产在线观看一区二区-麻豆国产在线观看免费-麻豆国产原创-麻豆国产一区二区在线观看

讓AI像人類一樣操作電腦！Anthropic上新Claude 3.5 Sonnet模型新能力快訊