智研咨詢 - 產(chǎn)業(yè)信息門戶

2019年中國人工智能在投研的應用發(fā)展規(guī)模及智能投研發(fā)展趨勢分析[圖]

    一、智能投研現(xiàn)狀

    狹義:人工智能在投資研究上的應用。通過人工智能技術拓寬投資信息來源,提高獲取信息的及時性,減少基礎數(shù)據(jù)處理的工作量,通過自動化的數(shù)據(jù)分析,為投資決策提供參考,從而提高投資研究的效率。

    廣義:人工智能在資本市場相關領域的應用。從使用者的角度來看,智能投研的受眾包括各種類型的投資者(買方)、券商(賣方)、監(jiān)管機構、銀行和財經(jīng)媒體等。從投資的標的來看覆蓋一級市場公司、股票、債券、外匯等。而人工智能的應用場景涉及業(yè)務的各種環(huán)節(jié),與投研直接相關的就包括研究、投資、交易和風險管理。

    1、供求

    大部分獨立的智能投研公司主要在數(shù)據(jù)的處理環(huán)節(jié)。最終與投資交易直接掛鉤的智能投研由投資機構自己搭建為主,同時會采購外部第三方的數(shù)據(jù)和服務,在內(nèi)部進行整合。

智能投研的流程及功能

數(shù)據(jù)獲取
數(shù)據(jù)處理
數(shù)據(jù)處理
數(shù)據(jù)輸出
•數(shù)據(jù)爬

•另類數(shù)
據(jù)
•結構化
•標準化
•標簽
•知識圖
•智能搜

•可視化
•預測

數(shù)據(jù)來源:公開資料整理

    產(chǎn)業(yè)鏈的上游是數(shù)據(jù)源。(1)傳統(tǒng)數(shù)據(jù)。金融行業(yè)本身已經(jīng)存在大量標準化的數(shù)據(jù),包括公司財務數(shù)據(jù)、公司公告、交易數(shù)據(jù)、宏觀數(shù)據(jù)、行業(yè)數(shù)據(jù)、券商研報等,這些數(shù)據(jù)主要由金融數(shù)據(jù)公司進行整合。(2)爬蟲數(shù)據(jù)。這些數(shù)據(jù)來自于互聯(lián)網(wǎng),相比傳統(tǒng)金融數(shù)據(jù)庫,這些數(shù)據(jù)的顆粒度更細,數(shù)據(jù)來源主要是地方政府網(wǎng)站、地方監(jiān)管部門網(wǎng)站、社交網(wǎng)站、媒體網(wǎng)站等。(3)另類數(shù)據(jù),主要指通過智能設備采集的數(shù)據(jù),包括衛(wèi)星圖片、天氣數(shù)據(jù)等,更多的是通過個人移動終端采集的各種數(shù)據(jù)。

    產(chǎn)業(yè)鏈的中游主要是數(shù)據(jù)的采集和標準化。產(chǎn)品形態(tài)包括數(shù)據(jù)處理的工具或者處理之后的數(shù)據(jù)產(chǎn)品。(1)數(shù)據(jù)抓取工具:直接對客戶開放的基礎產(chǎn)品,也是開發(fā)其他高級工具的底層技術。應用于標準化金融文本的關鍵信息摘取。(2)核查類工具:對于有明確規(guī)則的金融文本提供自動核查,包括核對財務數(shù)據(jù)。(3)產(chǎn)業(yè)鏈圖譜:通過打標簽和標簽之間的關系建立,細化行業(yè)分類,展現(xiàn)產(chǎn)業(yè)鏈上下游、競爭對手、股權投資等關系,尋找潛在的投資標的或發(fā)現(xiàn)潛在的風險傳導路徑。

    產(chǎn)業(yè)鏈的下游是數(shù)據(jù)的需求方和應用場景,以金融機構為主。(1)券商主要包括三個部門的需求。投行部門:提交文件的審核、找項目。網(wǎng)金部:APP智能投顧功能的底層支持。研究所:報告的質(zhì)控檢查、信息搜索、公告數(shù)據(jù)提取。(2)投資機構。一級市場投資者:找項目,監(jiān)控競爭對手。二級市場投資者:量化投資的策略因子、資產(chǎn)組合的監(jiān)控及風險預警。(3)證監(jiān)會&交易所:標準金融文本的審核、信息披露的監(jiān)控等監(jiān)管科技范疇。(4)其他需求。如銀行的小微企業(yè)信貸風控、尋找潛在的企業(yè)客戶;企業(yè)尋找合作伙伴等。

    2、參與者

    智能投研對于這些數(shù)據(jù)服務商來說可以提升數(shù)據(jù)采集的自動化程度,增加數(shù)據(jù)功能模塊。彭博、湯森路透是全球市占率最高的兩家金融數(shù)據(jù)公司,其優(yōu)勢在于數(shù)據(jù)全、顆粒度細、服務好,但價格比較高。商業(yè)模式也較為類似,除了提供數(shù)據(jù)終端之外,也是財經(jīng)媒體,擁有自己的電視臺、電臺。CaptitalIQ、Factset、MorningStar與頭部的兩家公司形成一定的差異化競爭,雖然數(shù)據(jù)不夠全,但在細分領域上做更深的數(shù)據(jù)挖掘和加工,且價格相對便宜。國內(nèi)金融數(shù)據(jù)服務市場的集中度更高,基本處于萬得一家獨大的狀態(tài)。

國內(nèi)外主要的金融數(shù)據(jù)服務商

區(qū)域
主要機構
海外
彭博、湯森路透、CaptitalIQ、Factset、MorningStar
國內(nèi)
Wind萬得、東方財富choice、同花順iFinD、恒生聚源

數(shù)據(jù)來源:公開資料整理

    在智能投研領域有大量的創(chuàng)業(yè)公司。這些創(chuàng)業(yè)團隊一般都具有人工智能的技術背景和金融行業(yè)從業(yè)經(jīng)歷。

    2、互聯(lián)網(wǎng)巨頭

    具有明顯的數(shù)據(jù)優(yōu)勢,可提供獨家因子給量化基金。BAT在人工智能領域均有布局,重點放在通用的基礎技術研發(fā)上。其中螞蟻金服在金融行業(yè)的布局較廣。螞蟻金服在底層通用技術的研發(fā)包括人臉識別技術、圖像識別技術、自然語言處理等,應用在泛金融場景中的包括智能客服、智能營銷、智能推送、智能定損、安全風控等。從整個資產(chǎn)管理行業(yè)來看,螞蟻金服在獲客、客戶運營方面有優(yōu)勢,在投研領域,互聯(lián)網(wǎng)巨頭在另類數(shù)據(jù)方面有明顯的優(yōu)勢,可以提供獨家的因子給投資機構。

    3、投資機構內(nèi)部研發(fā)

    就投資而言,外部第三方以提供數(shù)據(jù)工具為主,具體落地到投資策略制定和交易執(zhí)行一般在投資機構內(nèi)部。投資機構通常會外部采購標準模塊,疊加內(nèi)部投資策略,構建內(nèi)部智能投研系統(tǒng)。(1)海外智能投研使用已經(jīng)較為普遍。成熟的金融市場有充足的投資工具,運用人工智能的量化投資已積累了一定量的歷史數(shù)據(jù)。部分由人工智能管理的基金取得了超過業(yè)績基準的超額收益。(2)國內(nèi)的資本市場仍處于發(fā)展早期,歷史數(shù)據(jù)和交易工具比較缺乏,前幾年推出的大數(shù)據(jù)基金并未取得理想的業(yè)績表現(xiàn)。目前國內(nèi)有部分公募基金正在積極探索智能投研的應用,包括嘉實基金、天弘基金、富國基金、華夏基金等,智能投研的發(fā)展是資產(chǎn)管理行業(yè)的大勢所趨。

    4、人工智能

    在智能投研中主要應用的人工智能技術包括圖像識別、自然語言處理、情感分析、知識圖譜等。這些技術的使用本身存在遞進的關系。首先通過圖像識別技術,對圖像中印刷或者手寫的文字進行識別,輸出可以編輯的文檔格式。其次是通過自然語言處理及情感分析對本文進行結構化處理,變成機器可讀的數(shù)據(jù)。最后結合專家知識和機器學習等算法,建立起數(shù)據(jù)之間的關系網(wǎng)絡,實現(xiàn)一定程度的分析功能。

    人工智能的能力邊界。(1)優(yōu)勢:相比人工模式,人工智能拓展了數(shù)據(jù)來源,大幅提升了數(shù)據(jù)運算的能力。人腦習慣于線性關系和因果關系的分析,而機器能分析多元、非線性關系,尋找相關性而非局限于因果關系。(2)不足:就現(xiàn)階段來看,人工智能在有明確邊界、規(guī)則和目標的場景中,效果更明顯。例如:數(shù)據(jù)工具類產(chǎn)品主要應用于審核、檢查、核對等場景,這些場景的特征就是規(guī)則明確、目標清晰;人工智能已經(jīng)可以實現(xiàn)自動寫新聞,但自動寫的研究報告可用性不強,更適合上市公司財務數(shù)據(jù)披露使用,原因在于研究報告的分析角度受撰寫者的思考邏輯和知識背景差異而不同;人工智能在防范風險上的表現(xiàn)優(yōu)于尋找機會,歷史數(shù)據(jù)積累有助于風險模型的不斷優(yōu)化,而潛在的投資機會往往會突破原有的分析框架。(3)約束條件:數(shù)據(jù)質(zhì)量影響智能投研的效果,隨著底層數(shù)據(jù)質(zhì)量不斷提升,智能投研的效果會越來越好。

    5、自然語言處理

    自然語言處理(NLP)就是將復雜的人類自然交流的語言轉化成標準化的計算機語言。自然語言處理包括兩個部分,一是自然語言理解(NLU),使計算機理解人類的語言,二是自然語言生成(NLG),把計算機運算的結果以人類自然語言的形式呈現(xiàn)。

自然語言處理的四個層面

層面
描述
詞典構造
構造包含盡量多的語法信息、語義信息、語用信息等
的機器語言詞典,將其作為構建自然語言理解平臺的
基礎。
語法分析
對自然語言進行表層的形式化分析,包括詞法分析和
句法分析兩部分。詞法分析是將自然語言進行切分,
并將每個切分的詞加上詞性標記,它是句法分析的基
礎。句法分析是將句子的詞語序列映射為句法成分的
層次結構。
語義分析
在語法分析的基礎上理清句子的語義結構關系,對整
個句子的語義進行組合和表達并說明句子中詞語搭
配上存在的各種語義限制條件。
篇章分析
研究句子之間的關系以及整個篇章中包含的知識。

數(shù)據(jù)來源:公開資料整理

自然語言生成的三個功能

功能
描述
內(nèi)容規(guī)劃
決定生成的文本所要表達的內(nèi)容,并對已確定的內(nèi)容
進行結構化描述,使之符合閱讀理解習慣
句子規(guī)劃
進一步明確定義規(guī)劃文本的細節(jié)。
表層生成
將句子規(guī)劃后的文本描述映射至由文字、標點和結構
注解信息組成的表層文本

數(shù)據(jù)來源:公開資料整理

    情感分析是自然語言處理中的一個重要研究方面,主要是對帶有感情色彩的主觀性文本進行分析、處理、歸納和推理。情感分析的發(fā)展得益于社交媒體的興起,產(chǎn)生了大量個體參與的、對于人物、事件和產(chǎn)品的評論信息,通過機器學習,得出可量化的數(shù)據(jù)結論。

情感分析的步驟

步驟
描述
情感信息的提取
在文本中抽取有價值的情感信息
情感信息的分類
主要包括主、客觀信息的分類和主觀信息的情
感分類
情感信息檢索
可以檢索出與主題相關且包含情感信息的文
檔。
情感信息歸納
可以將與大量主題相關的情感文檔進行自動
分析和歸納并得出情感分析結論。

數(shù)據(jù)來源:公開資料整理

    自然語言處理的應用場景:大數(shù)據(jù)分析、日志挖掘及分析、自動摘要、文本分類、信息提取、文本朗讀/語音合成、語音識別、信息檢索、文字校對、機器翻譯、問答系統(tǒng)等。在金融行業(yè)的應用包括輿情監(jiān)測、智能風控、智能客服等。

    6、知識圖譜

    知識圖譜:將知識結構繪制成以各個知識單元概念為節(jié)點的地圖。知識圖譜的基礎是自然語言處理,在計算機對文本中的知識點理解之后,再建立起各個知識單元之間的關系,形成知識網(wǎng)絡,最后以可視化的形式展現(xiàn)出來,或者通過智能搜索引擎呈現(xiàn)。知識圖譜的底層是文本、標簽和表格,在此基礎上構建圖表、模式、本體和規(guī)則。

    投研領域的知識圖譜。在投研領域,知識單元包括公司、產(chǎn)品、股東、管理層等,知識單元之間的關系包括上下游、競爭對手、合作、股權、擔保等。知識圖譜可以知識單元之間的關系網(wǎng)絡直觀地顯示出來,當其中某個節(jié)點發(fā)生變化時,能快速識別出這個變化在關系網(wǎng)絡中的傳導過程及對特定主體的具體影響。

建立知識圖譜的步驟

步驟
描述
實體識別
從新聞資訊、公司公告、券商研究報告等海量的信
息源中抓取實體。
關系構建
基于機器學習等方法發(fā)掘實體之間的各種關系

數(shù)據(jù)來源:公開資料整理

    二、市場空間及行業(yè)趨勢

    要從數(shù)據(jù)服務廣義的角度看智能投研的市場空間。(1)如果僅從投資機構的付費能力看,智能投顧的市場空間有限。頭部的券商和具有一定資產(chǎn)管理規(guī)模的投資機構是收入的主要來源,機構數(shù)量和資產(chǎn)規(guī)模成為主要的限制條件。目前國內(nèi)傳統(tǒng)的金融數(shù)據(jù)服務被萬得基本壟斷,市占率超過80%,萬得2016年的營業(yè)收入為13.3億元,整個市場規(guī)模在20-30億元左右。(2)間增量空間1:投資機構需求的多元化。從數(shù)據(jù)層面,從傳統(tǒng)的結構化數(shù)據(jù)向非機構化數(shù)據(jù)拓展,而非結構化數(shù)據(jù)的規(guī)模占到80%。從服務層面,在數(shù)據(jù)功能上要不斷完善,提高自動化程度,減少簡單重復的人工作業(yè);此外數(shù)據(jù)服務與軟件服務相結合,形成綜合性的投資管理平臺。(3)增量空間2:目標客戶的多元化。從金融行業(yè)領域來看,除了投研部門之外,金融數(shù)據(jù)服務的對象豐富,包括投行業(yè)務部門、銀行信貸部門、監(jiān)管審核部門等。其他潛在客戶還有媒體、企業(yè)、政府、法律機構等。

    全球金融數(shù)據(jù)市場的規(guī)模達到260億美元,全球的資產(chǎn)管理規(guī)模約為80萬億美元;由證券業(yè)協(xié)會統(tǒng)計的國內(nèi)資產(chǎn)管理行業(yè)的約為50萬億元,而金融數(shù)據(jù)行業(yè)的規(guī)模僅為20-30億,與海外市場相比,市場潛力巨大。

2014-2018年主要上市金融數(shù)據(jù)公司的營業(yè)收入(億美元)

數(shù)據(jù)來源:公開資料整理

    資產(chǎn)管理行業(yè)是智能投研的主要客戶來源,資產(chǎn)管理行業(yè)的機構數(shù)量、資產(chǎn)規(guī)模決定了智能投研行業(yè)的收入規(guī)模。根據(jù)調(diào)查數(shù)據(jù)統(tǒng)計,截止2018年末,資產(chǎn)管理業(yè)務總規(guī)模約為50萬億元,其中包含了公募基金、私募基金、基金子公司、證券公司及期貨公司。從增速來看,由于近兩年宏觀經(jīng)濟增速下滑、資本市場波動及監(jiān)管趨嚴等因素影響,資產(chǎn)管理規(guī)模增速放緩,其中2018年整體規(guī)模有所下滑,但從2014年以來,規(guī)模的復合增速達到了25%。隨著資產(chǎn)管理行業(yè)成熟度提升,更多機構(保險機構、外資機構等)和資金(養(yǎng)老金、居民儲蓄等)進入資本市場,資產(chǎn)管理行業(yè)規(guī)模長期將保持增長態(tài)勢。

2014-2018年資產(chǎn)管理業(yè)務總規(guī)模(萬億元)

數(shù)據(jù)來源:公開資料整理

    一方面,投資機構通過自動化程序不斷提升運營效率,包括投資研究和交易;另一方面,投資交易的風格越來越偏被動和量化,逐漸降低人為主觀操作的比例,或者說通過技術手段更好的執(zhí)行投資經(jīng)理的投資策略,這些需求都要提升投資機構的科技投入。具體來說,β收益產(chǎn)品要求更低的管理成本和交易成本,提升跟蹤標的的準確度,α收益產(chǎn)品的管理難度不斷提升,需要持續(xù)發(fā)現(xiàn)新的、有效的投資策略才能獲取超額收益。Smartβ產(chǎn)品介于主動及被動管理之間,人工智能可以幫助該類產(chǎn)品進行動態(tài)的因子調(diào)整,進一步提升獲取超額收益的可能性。

    傳統(tǒng)的金融數(shù)據(jù)服務公司在數(shù)據(jù)積累及客戶資源上具備優(yōu)勢,通過外部并購優(yōu)秀的創(chuàng)業(yè)公司可提升數(shù)據(jù)產(chǎn)品能力,利用最前沿的人工智能技術,賦能已有的數(shù)據(jù)業(yè)務,增強客戶粘性、做大收入規(guī)模。例如標普全球公司最近兩年連續(xù)收購了固定收益技術供應商Algomi、替代數(shù)據(jù)技術公司UrsaSpaceSystems和Kensho以及機器學習與分析公司PanjivaInc。

    盡管海外金融數(shù)據(jù)市場非常成熟,頭部幾家基本都有數(shù)十年的歷史,但在一級市場上仍有大量的初創(chuàng)公司在細分領域進行探索,運用自然語言處理、知識圖譜等人工智能技術開發(fā)差異化的數(shù)據(jù)產(chǎn)品。

海外典型智能投研創(chuàng)業(yè)公司

公司
簡介
AlphaSense
搜索引擎,整合公司公告、新聞、研究報告中的
投資信息
Automated
Insights
自動寫作,自動撰寫新聞和上市公司的營收報
AlgoDynamix
風控系統(tǒng),對全球金融交易所數(shù)據(jù)進行實時分
析,及時發(fā)現(xiàn)市場異常,對潛在風險發(fā)出預警
VisibleAlpha
財務模型,整合各家賣方報告的財務預測模型,
除了三表之外,還包括其他業(yè)績驅動因素的分析
及預測。
Dataminr
社交數(shù)據(jù)的大數(shù)據(jù)挖掘,搜集社交媒體上的實時
數(shù)據(jù),包括每天5億條的推特,利用機器學習提
前發(fā)現(xiàn)可能會影響公司的事件。

數(shù)據(jù)來源:公開資料整理

    相關報告:智研咨詢發(fā)布的《2020-2026年中國人工智能行業(yè)市場消費調(diào)查及投資前景評估報告

本文采編:CY337
10000 12800
精品報告智研咨詢 - 精品報告
2025-2031年中國人工智能大模型行業(yè)市場運營態(tài)勢及發(fā)展趨向研判報告
2025-2031年中國人工智能大模型行業(yè)市場運營態(tài)勢及發(fā)展趨向研判報告

《2025-2031年中國人工智能大模型行業(yè)市場運營態(tài)勢及發(fā)展趨向研判報告》共十五章,包含中國人工智能大模型行業(yè)重點上市企業(yè)經(jīng)營狀況分析,2025-2031年中國人工智能大模型行業(yè)投資潛力分析,對2025-2031年中國人工智能大模型行業(yè)發(fā)展前景及趨勢預測等內(nèi)容。

如您有其他要求,請聯(lián)系:
公眾號
小程序
微信咨詢

文章轉載、引用說明:

智研咨詢推崇信息資源共享,歡迎各大媒體和行研機構轉載引用。但請遵守如下規(guī)則:

1.可全文轉載,但不得惡意鏡像。轉載需注明來源(智研咨詢)。

2.轉載文章內(nèi)容時不得進行刪減或修改。圖表和數(shù)據(jù)可以引用,但不能去除水印和數(shù)據(jù)來源。

如有違反以上規(guī)則,我們將保留追究法律責任的權力。

版權提示:

智研咨詢倡導尊重與保護知識產(chǎn)權,對有明確來源的內(nèi)容注明出處。如發(fā)現(xiàn)本站文章存在版權、稿酬或其它問題,煩請聯(lián)系我們,我們將及時與您溝通處理。聯(lián)系方式:gaojian@chyxx.com、010-60343812。

在線咨詢
微信客服
微信掃碼咨詢客服
電話客服

咨詢熱線

400-600-8596
010-60343812
返回頂部
在線咨詢
研究報告
可研報告
專精特新
商業(yè)計劃書
定制服務
返回頂部

全國石油產(chǎn)品和潤滑劑

標準化技術委員會

在用潤滑油液應用及

監(jiān)控分技術委員會

聯(lián)合發(fā)布

TC280/SC6在

用潤滑油液應

用及監(jiān)控分技

術委員會

標準市場調(diào)查

問卷

掃描二維碼進行填寫
答完即刻抽獎!