AI訓(xùn)練數(shù)據(jù)“第二股”花落北交所?數(shù)據(jù)堂啟動上市輔導(dǎo)
激石Pepperstone(http://hysxdzy.com/)報(bào)道:
作為人工智能(AI)“算法、算力、數(shù)據(jù)”三駕馬車之一,服務(wù)于訓(xùn)練數(shù)據(jù)的數(shù)據(jù)標(biāo)注公司正在更多的接近資本市場。
1月12日,新三板掛牌的數(shù)據(jù)標(biāo)注企業(yè)數(shù)據(jù)堂(831428.NQ)已向北京證監(jiān)局提交了上市輔導(dǎo)材料,計(jì)劃將在北交所啟動上市。
掛牌資料顯示,數(shù)據(jù)堂作為一家數(shù)據(jù)服務(wù)企業(yè),主要業(yè)務(wù)正是數(shù)據(jù)采集、制作、共享、交易、訂閱和應(yīng)用服務(wù),以及大數(shù)據(jù)的存儲、管理、挖掘、分析的專業(yè)系統(tǒng)解決方案,并致力于打造面向大眾的數(shù)據(jù)共享、交易及應(yīng)用平臺。
有AI行業(yè)人士指出,數(shù)據(jù)服務(wù)企業(yè)的最主要業(yè)務(wù),正是提供AI模型訓(xùn)練所需要的數(shù)據(jù)標(biāo)注服務(wù)。
值得一提的是,作為AI訓(xùn)練數(shù)據(jù)“第一股”的海天瑞聲(688787.SH)已于2021年8月登陸科創(chuàng)板上市,若數(shù)據(jù)堂此番順利上市,則意味著AI訓(xùn)練數(shù)據(jù)“第二股”有望在北交所亮相。
不過圍繞AI標(biāo)注行業(yè)的價(jià)值,業(yè)內(nèi)也爭議不斷。
有行業(yè)人士認(rèn)為,“大語言模型”的快速崛起正在加速標(biāo)注行業(yè)的自動化,而傳統(tǒng)的人工標(biāo)注業(yè)務(wù)將面臨出清;但也有分析人士指出,考慮到境內(nèi)數(shù)據(jù)、中文語境的特殊性以及大廠之間的大模型軍備競賽,數(shù)據(jù)標(biāo)注短期內(nèi)仍然存在較高需求。
業(yè)績勉強(qiáng)達(dá)標(biāo)
更早之前,數(shù)據(jù)堂沖刺北交所的跡象就已出現(xiàn)。
2023年5月,數(shù)據(jù)堂發(fā)起了員工股權(quán)激勵計(jì)劃,次月,又按照股轉(zhuǎn)系統(tǒng)要求成為當(dāng)年第四批進(jìn)入新三板創(chuàng)新層的企業(yè);而在2023年12月,還將主辦券商從先前的湘財(cái)證券改聘為民生證券。
“進(jìn)入創(chuàng)新層、同時(shí)又更換了主辦券商,倒回頭看這些動作都是在為北交所上市所進(jìn)行的準(zhǔn)備動作?!北本┮晃煌缎腥耸恐赋?,
僅從上述財(cái)務(wù)數(shù)據(jù)來看,數(shù)據(jù)堂對于北交所上市標(biāo)準(zhǔn)的達(dá)標(biāo)較為勉強(qiáng)。
財(cái)報(bào)顯示,數(shù)據(jù)堂2021年、2022年的歸母公司凈利潤分別為-0.08億元、0.14億元,加權(quán)平均凈資產(chǎn)收益率(ROE)分別為-8.82%、13.63%,尚不滿足北交所上市門檻。
不過在收入維度上,其2021年至2022年收入分別達(dá) 1.15億元、1.69 億元,其中2022年收入增速達(dá) 46.14%,剛好滿足北交所不低于4億元市值,且連續(xù)兩年收入不低于1億元,且2022年經(jīng)營活動現(xiàn)金流為正的要求。
有投行人士指出,該公司選擇在2024年年初啟動輔導(dǎo),意味著其尚未披露的后續(xù)業(yè)績有望進(jìn)一步改善。
“截至2023年上半年的數(shù)據(jù)來看,對上市標(biāo)準(zhǔn)的達(dá)標(biāo)較為勉強(qiáng),但有可能公司下半年以及今年的業(yè)績大概率能進(jìn)一步改善,所以會提前準(zhǔn)備輔導(dǎo)?!鄙鲜霰本┩缎腥耸勘硎尽?/p>
不過在2023年上半年,數(shù)據(jù)堂的業(yè)績反而是下滑的——其當(dāng)期營業(yè)收入0.61億元,同比下滑7.05%,歸母公司凈利潤更是虧損-0.06億元。
事實(shí)上,同在數(shù)據(jù)標(biāo)注賽道的海天瑞聲在2023年的已知業(yè)績也差強(qiáng)人意。其2023年前三季度營業(yè)收入1.03億元,同比下滑38.25%,歸母公司凈利潤虧損0.43億元。
“雖然(2023年)上半年AI非?;?,但是從兩家數(shù)據(jù)標(biāo)注公司的業(yè)績來看,仍然是下滑的,這有可能是是2022年情況后置的結(jié)果,因?yàn)闃?biāo)注本身是需要交付來確認(rèn)收入的?!币患疑鲜腥蘐MT行業(yè)分析師指出,“隨著各家大廠在AI訓(xùn)練上增大開支,后續(xù)確實(shí)有可能帶來這些公司的業(yè)績反轉(zhuǎn)?!?/p>
“不過也要考慮一個變量,就是各家大廠也在強(qiáng)化自身的數(shù)據(jù)標(biāo)注能力,而且一些數(shù)據(jù)涉及到商業(yè)秘密,所以這會對數(shù)據(jù)標(biāo)注外包公司帶來一定影響?!鄙鲜龇治鰩熤赋?。
從客戶陣容來看,數(shù)據(jù)堂的客戶的確包括了不少業(yè)內(nèi)大廠。
截至2022年末,百度、騰訊兩家大廠均是數(shù)據(jù)堂的前五大客戶,收入占比分別為3.85%、3.45%;截至2023年上半年末的應(yīng)收賬款顯示,高通、中汽數(shù)據(jù)、蔚來、Phantom AI等行業(yè)知名企業(yè)也是數(shù)據(jù)堂的存量客戶。
爭議標(biāo)注價(jià)值
圍繞海天瑞聲、數(shù)據(jù)堂等數(shù)據(jù)服務(wù)公司的上市,業(yè)內(nèi)有關(guān)該領(lǐng)域的價(jià)值爭議也始終不斷。
“人工智能主要需要算法、算力和數(shù)據(jù),一個好的AI引擎需要足夠的多的高質(zhì)量數(shù)據(jù)來訓(xùn)練,而數(shù)據(jù)標(biāo)注就是用來提高數(shù)據(jù)質(zhì)量的?!币患覈鴥?nèi)大廠AI工程師表示,“AI訓(xùn)練有時(shí)候往往缺乏足夠多的優(yōu)質(zhì)數(shù)據(jù),所以需要去采購數(shù)據(jù)集,但更多時(shí)候大廠是有數(shù)據(jù)的,但這些數(shù)據(jù)需要進(jìn)行標(biāo)注和優(yōu)化,因此就衍生了數(shù)據(jù)標(biāo)注這個行業(yè)?!?/p>
2023年初,ChatGPT帶著Transformer和大模型橫空出圈,引爆了新一輪有關(guān)AI領(lǐng)域的資本熱潮,盡管數(shù)據(jù)標(biāo)注作為AI淘金熱中的“賣鏟人”,但仍然有分析人士認(rèn)為大模型的普及將對傳統(tǒng)的數(shù)據(jù)標(biāo)注帶來沖擊。
“傳統(tǒng)的數(shù)據(jù)標(biāo)注業(yè)務(wù)很像‘包工頭’,就是標(biāo)注公司找一些勞務(wù)公司去幫忙從大學(xué)生中招臨時(shí)工來幫忙‘洗數(shù)據(jù)’,把手里不能用的原始數(shù)據(jù)通過標(biāo)注來升級成滿足AI訓(xùn)練標(biāo)準(zhǔn)的成品數(shù)據(jù)?!鄙鲜龃髲SAI工程師介紹。
“當(dāng)然并不是說只有標(biāo)注公司這么做,大廠也這樣干?!痹摴こ處熤赋?。
從供應(yīng)商來看,數(shù)據(jù)堂的上游確實(shí)是不少勞務(wù)公司。
2022年年報(bào)顯示,數(shù)據(jù)堂當(dāng)年前兩大供應(yīng)商分別為北京德元通遠(yuǎn)人力資源管理有限公司、永州眾樂邦企業(yè)管理有限公司,采購支出金額未0.13億元、0.29億元,占比分別為14.17%、3.15%
“某種程度上,數(shù)據(jù)標(biāo)注的門檻在于了解客戶的需求,從方向上是有門檻的,但是從業(yè)務(wù)形態(tài)來說,門檻又并不高。”上述AI工程師指出,“而且大模型成熟之后,這種勞務(wù)工作未來很有可能會被機(jī)器進(jìn)一步取代,實(shí)現(xiàn)自動化標(biāo)注。”
“GPT的發(fā)展短期來看有利于AI領(lǐng)域的投入,進(jìn)而對數(shù)據(jù)標(biāo)注行業(yè)帶來利好,但長期來看是對數(shù)據(jù)標(biāo)注的洗牌?!比A南一家公募基金投資經(jīng)理坦言?!拔磥砗饬繕?biāo)注企業(yè)的質(zhì)量,關(guān)鍵要看它們是否也會轉(zhuǎn)向大模型,進(jìn)而提供更優(yōu)質(zhì)、無法被輕易替代的標(biāo)注服務(wù)?!?/p>
從估值來看,2023年以來針對AI領(lǐng)域的估值熱潮正在退去。
以海天瑞聲為例,該公司在2023年一季度的AI行情攻勢下,三個月內(nèi)累計(jì)上漲達(dá)262.71%,但隨后便迎來估值腰斬——2023年二季度至今,其股價(jià)以累計(jì)下跌超過55%。
AI估值熱潮不再,會對于數(shù)據(jù)堂的上市帶來變數(shù),尚待觀察。
但也有分析人士認(rèn)為,考慮到境內(nèi)數(shù)據(jù)、中文數(shù)據(jù)的特殊性,國產(chǎn)大模型的訓(xùn)練仍然會產(chǎn)生特有的數(shù)據(jù)標(biāo)注需求,而對于匹配大模型訓(xùn)練場景的標(biāo)注公司來說,仍然具有需求拉動作用。
在一些大模型的標(biāo)準(zhǔn)建立過程中,也確實(shí)有數(shù)據(jù)標(biāo)注企業(yè)的存在。
例如日前中國信通院形成并發(fā)布的《大規(guī)模預(yù)訓(xùn)練模型基準(zhǔn)測試-總體技術(shù)要求》“方升”大模型評測體系中,包括海天瑞聲、國網(wǎng)智能電網(wǎng)研究院、首都之窗、天津大學(xué)、中國電信研究院、中國聯(lián)通軟件研究院、華為、甲骨易、東方財(cái)富在內(nèi)的9家單位成為了首批合作機(jī)構(gòu)。
數(shù)據(jù)堂似乎意識到了這一趨勢,其在2022年年報(bào)中就指出,將”重點(diǎn)服務(wù)數(shù)字經(jīng)濟(jì)、人工智能大模型等業(yè)務(wù)領(lǐng)域“。
“公司的數(shù)據(jù)要素服務(wù)將從人工智能傳統(tǒng)數(shù)據(jù)需求、垂直領(lǐng)域數(shù)據(jù)需求,并逐漸向類ChatGPT模式的大模型數(shù)據(jù)需求深入發(fā)展。”數(shù)據(jù)堂表示,“目前,預(yù)訓(xùn)練模型參數(shù)數(shù)量、訓(xùn)練數(shù)據(jù)規(guī)模按照300倍/年的趨勢增長,繼續(xù)通過增大模型和增加訓(xùn)練數(shù)據(jù)仍是短期內(nèi)主流演進(jìn)方向,RLHF技術(shù)的推廣使用或?qū)⑼苿佑?xùn)練數(shù)據(jù)市場需求持續(xù)延展?!?????????
掃描二維碼推送至手機(jī)訪問。
版權(quán)聲明:本文由激石Pepperstone發(fā)布,如需轉(zhuǎn)載請注明出處。