ChatGPT主導(dǎo)的對(duì)話式AI的普及,迅速拉近了普通人與人工智能的距離,使人和數(shù)據(jù)結(jié)合、交互比以往任何時(shí)候都更緊密、順暢。
在商業(yè)上,大模型正在與企業(yè)應(yīng)用迅速結(jié)合,重塑企業(yè)應(yīng)用中人與數(shù)據(jù)的交互方式,這方面的應(yīng)用不勝枚舉。如在自然語言處理領(lǐng)域,OpenAI的GPT-4模型已經(jīng)被用于各種任務(wù),包括文本生成、問答和語言理解等。在計(jì)算機(jī)視覺領(lǐng)域,F(xiàn)acebook的DETR模型被廣泛用于圖像識(shí)別任務(wù)。
相對(duì)于通用大模型訓(xùn)練難度大、投資大、運(yùn)營成本高、對(duì)于特定領(lǐng)域的適用性不佳等問題,星環(huán)科技在行業(yè)首家全面布局行業(yè)(領(lǐng)域)大模型發(fā)展。在5月26日舉辦的向星力·未來數(shù)據(jù)技術(shù)峰會(huì) (FDTC)上,星環(huán)科技行業(yè)大模型戰(zhàn)略布局全面亮相。
【資料圖】
星環(huán)科技創(chuàng)始人、CEO孫元浩表示,星環(huán)科技不僅可以為用戶提供大模型應(yīng)用構(gòu)建的全棧軟件工具,還基于自身在行業(yè)應(yīng)用領(lǐng)域的積累,推出兩大行業(yè)大模型。
推出MLOps工具鏈,改造和優(yōu)化現(xiàn)有的通用大模型
在大語言模型快速發(fā)展的今天,大語言模型能夠更好地幫助計(jì)算機(jī)了解人類的意圖。但是企業(yè)在實(shí)際使用中會(huì)發(fā)現(xiàn),由于通用大語言模型缺乏領(lǐng)域知識(shí)和知識(shí)推演能力,無法實(shí)際完成許多專業(yè)任務(wù)。
在通用大語言模型和企業(yè)應(yīng)用之間,存在著巨大的差距,需要通過LLMOps工具鏈來改造和優(yōu)化現(xiàn)有的通用大模型,形成真正能夠在某個(gè)行業(yè)內(nèi)專精的領(lǐng)域大模型,真正讓大語言模型技術(shù)更好地服務(wù)企業(yè)。
為了幫助企業(yè)用戶基于大模型構(gòu)建未來應(yīng)用,星環(huán)科技推出了大模型持續(xù)提升和開發(fā)工具Sophon LLMOps,實(shí)現(xiàn)領(lǐng)域大模型的訓(xùn)練、上架和迭代。Sophon LLMOps服務(wù)于大模型開發(fā)者,幫助企業(yè)快捷地構(gòu)建自己的行業(yè)大模型,通過大模型基礎(chǔ)設(shè)施,形成具備“新型人機(jī)交互”且“敏捷可持續(xù)迭代“的人工智能應(yīng)用。
星環(huán)科技Sophon LLM-Ops的工具鏈優(yōu)勢體現(xiàn)在以下幾個(gè)方面:
首先,Sophon LLMOps擁有自己的樣本倉庫能力,覆蓋訓(xùn)練數(shù)據(jù)開發(fā)、推理數(shù)據(jù)開發(fā)、數(shù)據(jù)維護(hù)等工作,對(duì)大語言模型涉及的原始數(shù)據(jù)、樣本數(shù)據(jù)、提示詞數(shù)據(jù)做清洗、探索、增強(qiáng)、評(píng)估和管理等。
第二,Sophon LLMOps具有模型運(yùn)維管理能力。除了傳統(tǒng)MLOps的六大統(tǒng)一——統(tǒng)一納管、統(tǒng)一運(yùn)維、統(tǒng)一應(yīng)用、統(tǒng)一監(jiān)控、統(tǒng)一評(píng)估、統(tǒng)一解釋外,針對(duì)大語言模型的微調(diào)、持續(xù)提升、評(píng)估、對(duì)齊等提供從計(jì)算框架、工具到計(jì)算、存儲(chǔ)、通信的調(diào)度和優(yōu)化支持。
第三,Sophon LLMOps具有大語言模型和其他任務(wù)的編排、調(diào)度和上線能力。Sophon LLMOps提供Agent、Ops、DAG,結(jié)合星環(huán)科技的多款大數(shù)據(jù)、數(shù)據(jù)庫產(chǎn)品,如向量庫Hippo和分布式圖數(shù)據(jù)庫StellarDB等,將不同大語言模型、傳統(tǒng)機(jī)器學(xué)習(xí)、其他流程等編排成符合用戶實(shí)際領(lǐng)域和業(yè)務(wù)需求的任務(wù),并為客戶提供服務(wù)。
星環(huán)科技Sophon LLMOps解決了客戶三個(gè)核心痛點(diǎn):
首先,提供一站式工具鏈,幫助客戶完成“通用大語言模型” 的訓(xùn)練、微調(diào),得到滿足自身業(yè)務(wù)特點(diǎn)的領(lǐng)域大語言模型。
其次,幫助客戶將原型的大語言模型應(yīng)用,成功地投入到實(shí)際生產(chǎn)中。
第三,幫助客戶運(yùn)營在生產(chǎn)中應(yīng)用的大語言模型,完成大模型的持續(xù)提升等。
向量數(shù)據(jù)庫與圖數(shù)據(jù)庫聯(lián)合構(gòu)建大模型應(yīng)用,讓每個(gè)人都擁有個(gè)性化的AI助理
孫元浩表示,數(shù)據(jù)處理從多模型向多模態(tài)轉(zhuǎn)型,從單一模態(tài)向多模態(tài)進(jìn)化,企業(yè)數(shù)據(jù)分析進(jìn)入了“新的次元”。
使用星環(huán)科技的向量數(shù)據(jù)庫和分布式圖數(shù)據(jù)庫,可以構(gòu)建基于大模型的應(yīng)用,讓每個(gè)人都擁有自己個(gè)性化的AI助理。星環(huán)科技推出了自研的向量數(shù)據(jù)庫Transwarp Hippo,拓展大語言模型時(shí)間和空間維度;星環(huán)科技打造面向圖智能、業(yè)務(wù)分析的多模型企業(yè)級(jí)分布式圖數(shù)據(jù)庫StellarDB 5.0,構(gòu)建海量數(shù)據(jù)互聯(lián)智慧“星”圖。
數(shù)據(jù)庫經(jīng)歷了40多年的發(fā)展,依然生機(jī)勃勃。隨著人工智能(AI)的發(fā)展,非結(jié)構(gòu)化數(shù)據(jù)應(yīng)用日益增多,數(shù)據(jù)體量大、格式多、存儲(chǔ)方式多樣,對(duì)這些數(shù)據(jù)的處理,傳統(tǒng)數(shù)據(jù)顯然無能為力,從而誕生了一種新的數(shù)據(jù)庫——向量數(shù)據(jù)庫(vector databases)。
向量數(shù)據(jù)庫主要用于AI應(yīng)用,如機(jī)器學(xué)習(xí)、自然語言處理、圖像識(shí)別等,并因?yàn)橹С挚焖俑咝У臄?shù)據(jù)存儲(chǔ)和檢索過程,而成為AI用例的理想選擇。
在此次的向星力·未來數(shù)據(jù)技術(shù)峰會(huì) (FDTC)上,星環(huán)科技推出了自研的向量數(shù)據(jù)庫Transwarp Hippo。作為一款企業(yè)級(jí)云原生分布式向量數(shù)據(jù)庫,星環(huán)科技Hippo支持存儲(chǔ)、索引以及管理海量的向量式數(shù)據(jù)集,能夠高效地解決向量相似度檢索、高密度向量聚類等問題。
與開源的向量數(shù)據(jù)庫不同,Hippo具備高可用、高性能、易拓展等特點(diǎn),支持多種向量搜索索引,支持?jǐn)?shù)據(jù)分區(qū)分片、數(shù)據(jù)持久化、增量數(shù)據(jù)攝取、向量標(biāo)量字段過濾混合查詢等功能,能很好地滿足企業(yè)針對(duì)海量向量數(shù)據(jù)的高實(shí)時(shí)性查詢、檢索、召回等場景。
大數(shù)據(jù)時(shí)代,應(yīng)該如何解決海量圖數(shù)據(jù)的存儲(chǔ)、計(jì)算難題呢?星環(huán)科技打造面向圖智能、業(yè)務(wù)分析的多模型企業(yè)級(jí)分布式圖數(shù)據(jù)庫StellarDB 5.0。
在性能上,StellarDB 5.0一騎絕塵,實(shí)現(xiàn)了實(shí)時(shí)短查詢場景5倍提升,高并發(fā)上萬+QPS,近50種圖算法,平均8倍性能提升,多度關(guān)聯(lián)關(guān)系場景10倍提升,解決無限擴(kuò)層問題。
同時(shí)StellarDB 5實(shí)現(xiàn)了圖算法可視化,帶來全面升級(jí)的數(shù)據(jù)可視化分析引擎KG Explorer 1.3,一款人人易用、面向業(yè)務(wù)、數(shù)據(jù)分析的可視化工具。
另外,StellarDB 5.0與星環(huán)科技自研的深度圖框架ZenGraph結(jié)合,基于圖數(shù)據(jù)庫的查詢計(jì)算能力,提供快速、準(zhǔn)實(shí)時(shí),甚至實(shí)時(shí)的特征查詢和計(jì)算;基于圖數(shù)據(jù)庫內(nèi)置算法,提供多元的圖特征計(jì)算能力;基于圖數(shù)據(jù)庫存儲(chǔ)能力,提供高速數(shù)據(jù)寫會(huì)能力;針對(duì)不同業(yè)務(wù)場景支持多種深度圖嵌入算法模型,相比于傳統(tǒng)圖算法,能夠從圖中挖掘?qū)W習(xí)更多的特征知識(shí),預(yù)測更精準(zhǔn)。
利用向量數(shù)據(jù)庫和圖數(shù)據(jù)庫,可以構(gòu)建特定領(lǐng)域的大模型應(yīng)用。在大模型應(yīng)用開發(fā)軟件棧中,知識(shí)圖譜、向量數(shù)據(jù)庫、模型倉庫和圖數(shù)據(jù)庫構(gòu)成的知識(shí)語義層,與模型運(yùn)行層、大語言模型、提示工程層、應(yīng)用前端集成層協(xié)同,幫助用戶創(chuàng)建大模型應(yīng)用,讓每個(gè)人都擁有自己的個(gè)性化AI助理。
其中,向量數(shù)據(jù)庫可用于應(yīng)用的文本檢索,讓查詢更滿足人性化的需求;可以實(shí)現(xiàn)語音、圖像、視頻檢索,覆蓋如人臉識(shí)別、語音識(shí)別、視頻指紋等各類AI場景;實(shí)現(xiàn)個(gè)性化推薦,做到千人千面的個(gè)性化推薦效果。
而圖數(shù)據(jù)庫和知識(shí)圖譜聯(lián)合,與大模型可視化端到端構(gòu)建工具一起,提供了知識(shí)抽取融合、知識(shí)建模、知識(shí)圖譜生成存儲(chǔ)、基于大模型的知識(shí)問答等閉環(huán)功能??蛻粢灾R(shí)圖譜作為大語言模型提示即可發(fā)起模型微調(diào),以較低代價(jià)就可獲得行業(yè)的專屬大語言模型問答應(yīng)用。
而向量數(shù)據(jù)庫、圖數(shù)據(jù)庫與大語言模型結(jié)合,可以構(gòu)建業(yè)務(wù)域知識(shí)圖譜和業(yè)務(wù)系統(tǒng)的應(yīng)用服務(wù),進(jìn)一步提高人機(jī)交互的效率,提供更靈活的組合業(yè)務(wù)服務(wù),激發(fā)出更多更深入的業(yè)務(wù)場景AI應(yīng)用。相較于通用大模型,結(jié)合向量數(shù)據(jù)庫、圖數(shù)據(jù)庫與知識(shí)圖譜所存儲(chǔ)的具體行業(yè)知識(shí),領(lǐng)域大模型更精通特定行業(yè)的知識(shí),具備高效的語料匹配能力和知識(shí)推理能力,能夠有效回答用戶的提問。
無涯金融量化投研大模型
針對(duì)量化投研領(lǐng)域特定的業(yè)務(wù)邏輯,星環(huán)科技通過預(yù)訓(xùn)、提示、增強(qiáng)、推導(dǎo)范式的構(gòu)建,實(shí)現(xiàn)Financial-Specific-LLM的訓(xùn)練,推出了金融行業(yè)量化投研大模型無涯Infinity。星環(huán)科技基于大模型的事件驅(qū)動(dòng)與深度圖引擎,實(shí)現(xiàn)對(duì)事件語義刻畫、定價(jià)因子挖掘、時(shí)序編碼、異構(gòu)關(guān)系圖卷積傳播,進(jìn)而構(gòu)建包含事件沖擊、時(shí)序變化、截面聯(lián)動(dòng)和決策博弈等多個(gè)維度的量化投研新范式。
星環(huán)科技無涯金融大模型,寓意學(xué)海無涯,既代表了投資領(lǐng)域終身學(xué)習(xí)的精神,也蘊(yùn)含了大模型本身在參數(shù)架構(gòu)方面持續(xù)迭代的內(nèi)涵??梢哉f無涯是一款面向金融量化領(lǐng)域、超大規(guī)模參數(shù)量的生成式大語言模型。主要通過自監(jiān)督的增量訓(xùn)練和有監(jiān)督的指令微調(diào),使用星環(huán)科技高性能計(jì)算集群訓(xùn)練而成。
首先,星環(huán)科技無涯使用上百萬的高質(zhì)量的專業(yè)金融語料,涵蓋了研報(bào)、公告、政策、新聞等高質(zhì)量的自然語言文本,作為基礎(chǔ)大模型的二次預(yù)訓(xùn)練語料,使得無涯具備對(duì)包括基本面、技術(shù)面、消息面在內(nèi)的金融通識(shí)領(lǐng)域準(zhǔn)確的理解能力,滿足行業(yè)分析師的需求。
其次,星環(huán)科技無涯使用了上百類特定事件類型和20多萬事件實(shí)例,完成對(duì)大模型的指令微調(diào),從而使得無涯能夠?qū)R專業(yè)研究員的分析推理能力,更加智能和可靠。
再次,在此基礎(chǔ)上,星環(huán)科技無涯構(gòu)建了包括政策、輿情、ESG、風(fēng)險(xiǎn)、量價(jià)、產(chǎn)業(yè)鏈等六類大模型基礎(chǔ)因子集,所構(gòu)建的復(fù)合因子體系滿足投資經(jīng)理的需求。
從應(yīng)用上看,無涯金融大模型強(qiáng)化以下幾個(gè)能力:
第一,針對(duì)金融行業(yè),擁有準(zhǔn)確理解和合理分析的能力。無涯擅長處理金融量化領(lǐng)域的各類問題,諸如在政策和研報(bào)分析、新聞解讀、事件總結(jié)和演繹推理上都具備強(qiáng)大的理解和生成能力。
第二,實(shí)現(xiàn)事件復(fù)盤分析與推演,貫通宏觀行業(yè)和大類資產(chǎn)分析邏輯。能夠?qū)善?、債券、基金、商品等各類市場事件進(jìn)行全面的復(fù)盤、傳播和推演。
第三,構(gòu)建六類大模型基礎(chǔ)因子集,支撐復(fù)合因子策略體系,能夠生成策略因子集合,構(gòu)建立體的歸因解釋體系。
毫無疑問,星環(huán)科技長期深耕金融領(lǐng)域,服務(wù)大量金融行業(yè)客戶,積累了上百萬金融專業(yè)領(lǐng)域的語料;基于星環(huán)科技對(duì)圖數(shù)據(jù)庫、深度圖推理算法的技術(shù),形成了大規(guī)模高質(zhì)量的金融類事件訓(xùn)練指令集。二者共同鑄就了星環(huán)科技開發(fā)金融領(lǐng)域大語言模型的堅(jiān)實(shí)底座。
大數(shù)據(jù)分析大模型SoLar“求索”,數(shù)據(jù)庫查詢平民化
同樣在大數(shù)據(jù)領(lǐng)域探索、積累長達(dá)10年的星環(huán)科技,基于在SQL編輯器的多年積累,結(jié)合大語言模型,推出了星環(huán)科技大數(shù)據(jù)分析大模型SoLar求索。用戶可以通過自然語言,生成可成功執(zhí)行的SQL或Cypher,從而快速獲取查詢的結(jié)果,能夠快速降低用戶的使用門檻。
星環(huán)科技此次發(fā)布的SoLar求索,將作為數(shù)據(jù)查詢和分析的智能副手,為數(shù)據(jù)工程師、數(shù)據(jù)科學(xué)、業(yè)務(wù)人員等提供更好的使用體驗(yàn)。這些非大數(shù)據(jù)分析的專業(yè)用戶,可以利用 SoLar求索,在不需要學(xué)習(xí)和掌握數(shù)據(jù)庫編程語言的前提下,可以使用自然語言自由地按需查詢數(shù)據(jù)。
星環(huán)科技的數(shù)據(jù)分析大模型SoLar求索包含多個(gè)數(shù)據(jù)分析大語言模型。本次展示的是自然語言進(jìn)行數(shù)據(jù)分析(SQL類)的能力。用戶可以通過自然語言提問,從星環(huán)科技的大數(shù)據(jù)平臺(tái)上的多張數(shù)據(jù)表中查詢出所需結(jié)果,并快速做出相應(yīng)數(shù)據(jù)分析和相應(yīng)的分析結(jié)果展現(xiàn)。
相較于傳統(tǒng)方式,應(yīng)用星環(huán)科技SoLar求索的好處包括:
首先,可以使用自然語言描述業(yè)務(wù)需求,方便對(duì)多張數(shù)據(jù)表進(jìn)行關(guān)聯(lián),并使用各種星環(huán)科技大數(shù)據(jù)分析平臺(tái)提供的函數(shù)進(jìn)行分析計(jì)算,讓數(shù)據(jù)庫查詢平民化。
其次,可以使用自然語言描述涉及多種數(shù)據(jù)模型的復(fù)雜業(yè)務(wù)需求,借助星環(huán)科技大數(shù)據(jù)平臺(tái)特有的多模型技術(shù),對(duì)不同模態(tài)如圖數(shù)據(jù)、文本數(shù)據(jù)、結(jié)構(gòu)化數(shù)據(jù)等的數(shù)據(jù)進(jìn)行關(guān)聯(lián)分析和展示。
同時(shí),為了保障生產(chǎn)可用和避免大語言模型的“幻覺”問題,星環(huán)科技Solar求索還為客戶提供了交互式數(shù)據(jù)分析的方式,方便客戶利用數(shù)據(jù)表與表之間的ER圖(實(shí)體-聯(lián)系圖),指定想使用的數(shù)據(jù)庫/表,提供數(shù)據(jù)分析代碼的一步步解釋,從而生成可被追溯、可被理解、同時(shí)更準(zhǔn)確的分析能力。
AI大模型時(shí)代,正在加速AI應(yīng)用的普及化。星環(huán)科技一方面為為用戶提供大模型應(yīng)用構(gòu)建的軟件工具,同時(shí)基于自身在行業(yè)應(yīng)用領(lǐng)域的積累,推出無涯金融大模型和大數(shù)據(jù)分析大模型SoLar求索兩大行業(yè)應(yīng)用大模型,幫助用戶應(yīng)對(duì)大模型時(shí)代的挑戰(zhàn)。
本文來源:財(cái)經(jīng)報(bào)道網(wǎng)
關(guān)鍵詞:
凡注有"實(shí)況網(wǎng)-重新發(fā)現(xiàn)生活"或電頭為"實(shí)況網(wǎng)-重新發(fā)現(xiàn)生活"的稿件,均為實(shí)況網(wǎng)-重新發(fā)現(xiàn)生活獨(dú)家版權(quán)所有,未經(jīng)許可不得轉(zhuǎn)載或鏡像;授權(quán)轉(zhuǎn)載必須注明來源為"實(shí)況網(wǎng)-重新發(fā)現(xiàn)生活",并保留"實(shí)況網(wǎng)-重新發(fā)現(xiàn)生活"的電頭。
熱點(diǎn)
- 【全球新要聞】視頻熱傳!日本賽馬場上馬匹突然倒地猝死,前騎手言論引爭議
- 中國動(dòng)力:公司風(fēng)電相關(guān)產(chǎn)品將隨著風(fēng)電產(chǎn)業(yè)尤其是海上風(fēng)電的快速發(fā)展給公司帶來新的發(fā)展機(jī)遇|每日觀察
- 當(dāng)虹科技(688039):5月30日技術(shù)指標(biāo)出現(xiàn)看漲信號(hào)-“紅三兵”
- 世界觀察:曬童年、憶童趣,快來分享你的童年回憶
- 世界短訊!【港股異動(dòng)】合景泰富集團(tuán)(01813.HK)漲10.17%
- 這些年,國企改革帶來新變化_世界熱訊
- 世界今亮點(diǎn)!汪清縣長榮街道長榮社區(qū)開展“美好生活·民法典相伴”宣傳活動(dòng)
- 四部門啟動(dòng)高校畢業(yè)生等青年就業(yè)創(chuàng)業(yè)政策宣傳周活動(dòng)_全球熱點(diǎn)
- 工信部:1-4月份規(guī)模以上電子信息制造業(yè)實(shí)現(xiàn)營收4.31萬億元,同比下降4.7%-環(huán)球觀焦點(diǎn)
- 世界熱資訊!【東海期貨5月30日產(chǎn)業(yè)鏈日?qǐng)?bào)】貴金屬篇:伊拉克央行黃金儲(chǔ)備提升,金價(jià)震蕩
頭條
- 每日觀點(diǎn):讓所有人遠(yuǎn)離饑餓——袁隆平的故事
- 世界頭條:中國星辰 | 270秒回顧“神十六”飛天激動(dòng)時(shí)刻
- 雙面“繡”姑蘇——人文經(jīng)濟(jì)視野下的蘇州觀察
- 新華全媒+丨11年過去了,那些爬懸崖天梯上學(xué)的孩子們長大了-天天亮點(diǎn)
- 中國星辰|增強(qiáng)現(xiàn)實(shí)技術(shù)詳解中國航天“三垂一遠(yuǎn)”測發(fā)模式
- “奔跑”的三夏·中國豐收地圖 世界看點(diǎn)
- 太湖港灌區(qū)項(xiàng)目開工建設(shè) 將提高區(qū)域內(nèi)糧食綜合生產(chǎn)能力 當(dāng)前觀點(diǎn)
- 學(xué)法時(shí)習(xí)之|6月,這些新規(guī)將影響你我生活
- 焦點(diǎn)熱文:數(shù)智賦能 為發(fā)射場插上“智慧化翅膀”
- 全球速讀:C919首航飛機(jī)餐曝光!乘客第一視角是什么體驗(yàn)?