无码人妻精品一区二区三区9厂-国产精品人人做人人爽人人添-在线永久免费观看黄网站-国产精品久久久久一区二区三区

中國(guó)自動(dòng)化學(xué)會(huì)專家咨詢工作委員會(huì)指定宣傳媒體
新聞詳情

斬獲全球四項(xiàng)第一!優(yōu)必選自研人形機(jī)器人最強(qiáng)大腦Thinker登頂全球

http://www.gjzbw99.com 2025-09-09 10:16 來(lái)源:優(yōu)必選

近日,優(yōu)必選自主研發(fā)的人形機(jī)器人Walker最強(qiáng)大腦——百億參數(shù)基座的多模態(tài)大模型:優(yōu)必選Thinker,在機(jī)器人感知與規(guī)劃領(lǐng)域三大國(guó)際權(quán)威基準(zhǔn)測(cè)試——分別由微軟、谷歌等發(fā)起與提出的MS COCO Detection Challenge、RoboVQA與Egoplan-bench2中,針對(duì)二十一個(gè)場(chǎng)景、四大類型的任務(wù)規(guī)劃等命題,優(yōu)必選一舉斬獲四項(xiàng)全球榜單第一。榜單吸引了來(lái)自英偉達(dá)、北京智源研究院、上海AI Lab等全球頂尖團(tuán)隊(duì),角逐激烈。優(yōu)必選這次取得的成績(jī)不僅體現(xiàn)了其機(jī)器人在復(fù)雜環(huán)境感知、語(yǔ)義理解與長(zhǎng)程任務(wù)規(guī)劃方面的全方位技術(shù)領(lǐng)先性,也標(biāo)志著人形機(jī)器人Walker S系列的“最強(qiáng)大腦”實(shí)現(xiàn)關(guān)鍵進(jìn)化。

多模態(tài)感知+強(qiáng)推理規(guī)劃賦能工業(yè)場(chǎng)景規(guī)?;瘧?yīng)用

在智能化浪潮席卷全球的當(dāng)下,人形機(jī)器人的規(guī)劃能力已成為關(guān)鍵競(jìng)爭(zhēng)維度之一。傳統(tǒng)機(jī)器人系統(tǒng)依賴預(yù)設(shè)指令執(zhí)行任務(wù),難以應(yīng)對(duì)高度動(dòng)態(tài)、多變的現(xiàn)實(shí)場(chǎng)景。而本次三大基準(zhǔn)測(cè)試的核心,正是針對(duì)人形機(jī)器人在復(fù)雜環(huán)境中的多模態(tài)感知和推理規(guī)劃能力進(jìn)行系統(tǒng)化驗(yàn)證。

MS COCO detection challenge由微軟發(fā)起,是計(jì)算機(jī)視覺(jué)領(lǐng)域的權(quán)威評(píng)測(cè)基準(zhǔn)之一,在全球?qū)W術(shù)界與工業(yè)界享有極高認(rèn)可度,常年被眾多頂尖論文與技術(shù)報(bào)告用作感知算法性能的衡量標(biāo)準(zhǔn)。

RoboVQA和Egoplan-bench2則分別由谷歌DeepMind和香港大學(xué)提出,致力于構(gòu)建機(jī)器人第一視角推理與任務(wù)規(guī)劃的公開(kāi)標(biāo)準(zhǔn)基準(zhǔn)測(cè)試,重點(diǎn)關(guān)注多模態(tài)、長(zhǎng)周期任務(wù)規(guī)劃能力。參與排名的模型包括北京智源、英偉達(dá)ThinkAct、Cosmos-reason1、GPT-4V、Qwen2.5-vl等。

優(yōu)必選Thinker在MS COCO detection challenge - Segmentation Mask中排名第一

優(yōu)必選Thinker在MS COCO detection challenge - Bounding Box排名中并列第一

優(yōu)必選Thinker在RoboVQA與Egoplan-bench2中排名第一

這一成績(jī)的背后,是優(yōu)必選自主研發(fā)的Thinker架構(gòu)與訓(xùn)練框架所提供的技術(shù)支撐,通過(guò)多項(xiàng)關(guān)鍵技術(shù)創(chuàng)新性整合,系統(tǒng)化提升了人形機(jī)器人的感知與推理規(guī)劃能力,為工業(yè)場(chǎng)景的規(guī)?;瘧?yīng)用奠定基礎(chǔ)。

Prompt:"Move the material box to the conveyor belt."Thinker:"First locate the conveyor belt, then place the material box."Walker S2在工業(yè)場(chǎng)景中自主完成上料

第一,自研視覺(jué)編碼器基座,構(gòu)建精準(zhǔn)環(huán)境感知。優(yōu)必選以ViT作為視覺(jué)編碼器原型,結(jié)合Co-DETR檢測(cè)頭,依托Object 365等開(kāi)源數(shù)據(jù)在通用視覺(jué)任務(wù)上進(jìn)行預(yù)訓(xùn)練,并通過(guò)多階段模態(tài)對(duì)齊機(jī)制實(shí)現(xiàn)了視覺(jué)-語(yǔ)言模態(tài)的高效融合。最終,在優(yōu)必選機(jī)器人數(shù)據(jù)集上進(jìn)行微調(diào),顯著提升機(jī)器人在工業(yè)場(chǎng)景中對(duì)物體、障礙和操作上下文的識(shí)別能力,為復(fù)雜環(huán)境下穩(wěn)定可靠的多模態(tài)環(huán)境感知奠定了堅(jiān)實(shí)基礎(chǔ)。

第二,超大規(guī)模參數(shù)架構(gòu),提供強(qiáng)大語(yǔ)義理解基礎(chǔ)。優(yōu)必選自研了具有百億參數(shù)的多模態(tài)大模型Thinker基座,實(shí)現(xiàn)視覺(jué)-語(yǔ)言-時(shí)間的跨域統(tǒng)一表征,使機(jī)器人能夠在多場(chǎng)景中準(zhǔn)確捕捉環(huán)境細(xì)節(jié)、理解任務(wù)指令并做出推理,為自動(dòng)化操作提供可靠的認(rèn)知基礎(chǔ)。

第三,時(shí)序增強(qiáng)算法與強(qiáng)化學(xué)習(xí)方法,增強(qiáng)長(zhǎng)程任務(wù)規(guī)劃連貫可靠。通過(guò)大模型蒸餾技術(shù),將百億參數(shù)模型效果濃縮至7B參數(shù)模型中,在保持高性能的同時(shí)增強(qiáng)多步驟任務(wù)分解與連續(xù)決策能力。該優(yōu)化使模型可以在端側(cè)部署,用機(jī)器人自身搭載的算力就可實(shí)時(shí)自主拆解復(fù)雜流程,避免規(guī)劃中斷或邏輯混亂,在流程嚴(yán)格、環(huán)環(huán)相扣的工業(yè)場(chǎng)景中展現(xiàn)出關(guān)鍵價(jià)值,將有力保障生產(chǎn)連貫性和操作安全性。

通用基礎(chǔ)能力打造+工業(yè)場(chǎng)景精調(diào)共創(chuàng)工業(yè)人形機(jī)器人應(yīng)用生態(tài)

工業(yè)場(chǎng)景的精調(diào)策略正成為推動(dòng)多模態(tài)大模型邁向?qū)嶋H應(yīng)用的關(guān)鍵力量,為人形機(jī)器人在生產(chǎn)線上的穩(wěn)定、高效部署奠定了技術(shù)基礎(chǔ),加速其從技術(shù)驗(yàn)證走向規(guī)?;瘜?shí)戰(zhàn)應(yīng)用的進(jìn)程。

優(yōu)必選創(chuàng)新性地采用“通用基礎(chǔ)能力打造+工業(yè)場(chǎng)景精調(diào)”的微調(diào)策略,基于超200萬(wàn)條視頻數(shù)據(jù)構(gòu)成的大規(guī)模訓(xùn)練集進(jìn)行預(yù)訓(xùn)練,隨后引入優(yōu)必選在工廠實(shí)訓(xùn)中積累的億級(jí)工業(yè)數(shù)據(jù)集進(jìn)行微調(diào),并對(duì)工業(yè)場(chǎng)景任務(wù)規(guī)劃數(shù)據(jù)加以清洗與整合,構(gòu)建高效多模態(tài)大模型學(xué)習(xí)閉環(huán)。通過(guò)這一流程,模型能夠快速學(xué)習(xí)工業(yè)場(chǎng)景的視覺(jué)特征、任務(wù)規(guī)則與操作偏好,最終顯著提升人形機(jī)器人在工業(yè)場(chǎng)景中的理解準(zhǔn)確率、規(guī)劃適配性與決策可靠性,實(shí)現(xiàn)在多種復(fù)雜場(chǎng)景中的泛化性與穩(wěn)定性。

Prompt:"Move the material box onto the pile of boxes next to it."Thinker:"The middle slot is the best one for the material box."Walker S2在工業(yè)場(chǎng)景中自主規(guī)劃任務(wù)

在Thinker大模型技術(shù)體系的全方位賦能下,優(yōu)必選新一代工業(yè)人形機(jī)器人Walker S2 實(shí)現(xiàn)“最強(qiáng)大腦”再進(jìn)化,不僅具備高精準(zhǔn)環(huán)境感知能力,更能夠在動(dòng)態(tài)場(chǎng)景中高效完成任務(wù)分解、實(shí)時(shí)調(diào)整與穩(wěn)定規(guī)劃。借助Thinker,Walker S2可精準(zhǔn)識(shí)別設(shè)備、物料與障礙物,深度理解場(chǎng)景語(yǔ)義及操作前后邏輯關(guān)聯(lián),顯著提升長(zhǎng)周期任務(wù)的執(zhí)行穩(wěn)定性。在復(fù)雜流水線環(huán)境中,機(jī)器人展現(xiàn)出持續(xù)連貫的規(guī)劃能力,大幅降低對(duì)人工干預(yù)的依賴。

實(shí)際應(yīng)用數(shù)據(jù)顯示,相比僅基于通用數(shù)據(jù)微調(diào)的模型,采用工業(yè)數(shù)據(jù)集進(jìn)行二次微調(diào)后,Walker S2在拆碼垛規(guī)劃等典型任務(wù)的中的規(guī)劃精度提升超過(guò) 20%,有力驗(yàn)證了該技術(shù)方案的產(chǎn)業(yè)化價(jià)值,相關(guān)技術(shù)報(bào)告將在arxiv上發(fā)布。

Prompt:"Move the material box onto the roller rack."Thinker:"First locate the roller rack and then place material box."Walker S2在工業(yè)場(chǎng)景中自主規(guī)劃任務(wù)

當(dāng)前,人形機(jī)器人正在進(jìn)入大規(guī)模應(yīng)用的關(guān)鍵階段,其發(fā)展亟需與開(kāi)發(fā)者共同構(gòu)建開(kāi)放、協(xié)同的應(yīng)用生態(tài)。為此,優(yōu)必選將逐步開(kāi)源一系列業(yè)界稀缺的工業(yè)場(chǎng)景數(shù)據(jù)集與通用基礎(chǔ)大模型,為全行業(yè)提供源自實(shí)際應(yīng)用一線的高質(zhì)量合規(guī)數(shù)據(jù)資源。開(kāi)發(fā)者可基于優(yōu)必選多模態(tài)大模型Thinker,面向各類新場(chǎng)景開(kāi)展精調(diào)與二次開(kāi)發(fā),助力提升開(kāi)發(fā)效率。我們期待與全球開(kāi)發(fā)者攜手,共創(chuàng)工業(yè)人形機(jī)器人的應(yīng)用生態(tài),為具身智能行業(yè)的加速發(fā)展注入持續(xù)動(dòng)能。

版權(quán)所有 工控網(wǎng) Copyright?2025 Gkong.com, All Rights Reserved