達晨财智窦勇:淺析大(dà)數據産業投資
達晨财智是一家比較傳統的(de)VC機構。自2000年成立以來(lái),達晨累計投資企業達467家,資金管理(lǐ)規模250億人(rén)民币,IPO上市75家,新三闆挂牌91家。
如圖所示,我們團隊在大(dà)數據行業布局了(le)6大(dà)領域:數據規劃、數據源、數據存儲、數據應用(yòng)、可(kě)視化(huà)和(hé)數據安全。共計30個(gè)項目,整體的(de)投資金額在10個(gè)億左右。幸運的(de)是,在我們投完之後,這(zhè)些企業的(de)次輪融資金額和(hé)融資幅度都出現了(le)大(dà)規模增長(cháng),當然這(zhè)隻是一個(gè)賬面價值。
2雲計算(suàn)vs大(dà)數據vs人(rén)工智能
開始今天的(de)第一個(gè)議(yì)題:淺析大(dà)數據與雲計算(suàn)、人(rén)工智能之間的(de)區(qū)别。
2.1
雲計算(suàn)
從定義來(lái)看,雲計算(suàn),隻是解決一個(gè)問題——資源的(de)管理(lǐ)。什(shén)麽樣的(de)資源呢(ne)?三個(gè)方面,一是計算(suàn)資源,二是存儲,三是網絡資源。
我們都知道,物(wù)理(lǐ)機一開始出現的(de)時(shí)候,就好比我自己家裏要買一台服務器,你肯定會關注三個(gè)東西:CPU、内存和(hé)網絡。那麽,是不是把很多(duō)的(de)物(wù)理(lǐ)機集中在一起,就形成IDC中心了(le)呢(ne)?這(zhè)裏需要用(yòng)到國外的(de)一個(gè)叫VMware的(de)虛拟軟件。它通(tōng)過組網把多(duō)台物(wù)理(lǐ)機連接在了(le)一起,就形成了(le)IDC中心。下(xià)一步是雲計算(suàn)。現在的(de)雲計算(suàn)很簡單,我隻要一個(gè)賬号,我需要多(duō)少網絡計算(suàn)資源和(hé)存儲資源,包括網絡通(tōng)信資源,都是随時(shí)給你的(de),它就充分(fēn)實現了(le)資源的(de)彈性,也(yě)就是所謂的(de)時(shí)間的(de)靈活性和(hé)空間的(de)靈活性。但是當虛拟軟件VMware剛開始出來(lái)的(de)時(shí)候,雖然它解決了(le)時(shí)間的(de)靈活性,卻沒有解決空間的(de)靈活性。這(zhè)是什(shén)麽概念呢(ne)?雖然我們都知道虛拟機可(kě)以在數據中心去解決數據的(de)部署,但是當時(shí)懂(dǒng)它的(de)腳本的(de)人(rén)極少。于是通(tōng)過算(suàn)法,也(yě)就是所謂的(de)調度,通(tōng)過計算(suàn)機自己的(de)算(suàn)法去分(fēn)配,我這(zhè)個(gè)數據中心中幾百台或者上千台服務器它什(shén)麽時(shí)間點去分(fēn)享自己的(de)共享資源,這(zhè)樣就解決了(le)雲計算(suàn)的(de)空間問題。在這(zhè)個(gè)領域比較出名的(de)一家企業叫VMware,非常賺錢。因爲你不需要跑客戶銷售了(le),你需要計算(suàn)資源,你找我,我給你個(gè)賬号就行了(le)。但是世界上技術大(dà)牛太多(duō)了(le),想要做(zuò)到技術完全領先是不可(kě)能的(de)。那你閉源,我就搞開源的(de)東西,所以後面就出現了(le)閉源解決方案,也(yě)就是所謂的(de)雲計算(suàn)最底層——IaaS層,也(yě)就是計算(suàn)資源的(de)管理(lǐ)架構。所謂IaaS層,就是我要把所有的(de)服務器,我所需要的(de)計算(suàn)資源管起來(lái)。
雲資源不能隻管計算(suàn)資源,還(hái)要管跑在上面的(de)應用(yòng)。通(tōng)過在計算(suàn)資源接口上加一個(gè)PaaS層,能達到兩個(gè)目的(de):一是把計算(suàn)資源管起來(lái);二是把上面應用(yòng)的(de)部分(fēn)管起來(lái)。PaaS層,承上是要把物(wù)理(lǐ)世界的(de)機器管起來(lái),承下(xià)就是把上面的(de)應用(yòng)管起來(lái)。
雲的(de)形态現在有幾種:私有雲、公有雲和(hé)混合雲。簡單來(lái)講,我有錢,我把服務器建在自己家裏面,那就是私有雲,不對(duì)外開放;如果像亞馬遜、微軟這(zhè)類做(zuò)運營平台的(de),他(tā)把服務器建在自己中心裏面,那這(zhè)就是公有雲;很多(duō)企業現在是混合雲,什(shén)麽概念呢(ne)?可(kě)能一些核心的(de)數據資産必須要自建服務器,但是像OA或者門戶網站這(zhè)些,東西可(kě)以放在公有雲上面,這(zhè)樣就可(kě)以降低成本。
亞馬遜這(zhè)家公司,很多(duō)人(rén)認爲它是一個(gè)電商平台。但是你看它2017年的(de)财報,它的(de)125億美(měi)金的(de)雲銷售平台業務,其中有31億美(měi)金是淨利潤,那它其實是一個(gè)大(dà)的(de)雲平台廠商。它的(de)開源就開發了(le)虛拟軟件技術,但是閉源就把雲化(huà)的(de)東西給你鎖死了(le),作爲它自己的(de)核心技術。那這(zhè)個(gè)怎麽辦呢(ne)?在美(měi)國還(hái)有一家公司叫Rackspace,這(zhè)家公司起步比較晚,行業内排名第二。他(tā)聯合了(le)美(měi)國航空航天局,共同研發了(le)OpenStack——一個(gè)開源的(de)雲計算(suàn)管理(lǐ)平台項目。随著(zhe)後續所有的(de)軟件廠商都加入了(le)公有雲平台,OpenStack逐漸成爲了(le)行業技術标準。OpenStack充分(fēn)實現了(le)公有雲資源的(de)時(shí)間、空間的(de)靈活性,實現了(le)計算(suàn)、存儲、網絡資源的(de)彈性。
通(tōng)俗地講,雲計算(suàn)就是把所有閑置的(de)服務器通(tōng)過一定的(de)技術,讓所有想要的(de)人(rén)在任何時(shí)間點、在任何空間獲取你所需要的(de)雲計算(suàn)成本。
2.2大(dà)數據
我們回到今天的(de)主題——大(dà)數據,它跟雲計算(suàn)有什(shén)麽關系呢(ne)?我們先講講大(dà)數據是什(shén)麽。
我個(gè)人(rén)認爲,數據本身并不具備價值,隻能獲取信息,信息經過整理(lǐ)才能成爲知識,知識經過應用(yòng)才能誕生智慧。所以“大(dà)數據”這(zhè)個(gè)概念提起來(lái)很新,但其實裏面有這(zhè)樣的(de)一個(gè)邏輯。這(zhè)裏面講兩個(gè)因素吧。“驅動大(dà)數據技術”這(zhè)個(gè)詞最近被炒得(de)很熱(rè),它包括兩個(gè)方面:一個(gè)是計算(suàn)性能的(de)提升,一個(gè)是存儲成本的(de)降低。這(zhè)兩個(gè)因素驅動著(zhe)整個(gè)産業不斷地更新叠代。
我們先看一下(xià)國外。21世紀互聯網經濟之前,沒有承載這(zhè)些數據的(de)載體的(de)時(shí)候,沒有存儲收集這(zhè)些數據工具的(de)時(shí)候,那時(shí)候的(de)信息化(huà)尚未完成,數據量較少。直到2005年,雅虎爲了(le)解決網頁搜索的(de)問題,成立了(le)一個(gè)攻關小組。小組項目最後是失敗了(le),但沉澱下(xià)來(lái)了(le)兩大(dà)核心技術,一是高(gāo)性能計算(suàn),二是分(fēn)布式存儲。這(zhè)兩項技術出來(lái)了(le)以後,沉寂了(le)一段時(shí)間,因爲這(zhè)個(gè)行業不是一直往上走。真正引起轟動的(de)是2009年Splunk上市的(de)時(shí)候,當天的(de)股價溢價高(gāo)達39%,一下(xià)子引起了(le)整個(gè)投資界轟動。美(měi)國最有名的(de)事件之一,就是Plantir這(zhè)件事情。它瘋狂的(de)是什(shén)麽呢(ne)?沒有上市的(de)一家公司,估值卻高(gāo)達200億美(měi)金。而實際上它并不神秘。Plantir一開始是被美(měi)國中央情報局CIA定點扶持的(de)企業,就是幫CIA抓人(rén)。比較有标志性的(de)事件,就是本拉登的(de)位置線索。他(tā)提供了(le)一些算(suàn)法,或者隐形數據分(fēn)析。這(zhè)個(gè)事件對(duì)于整個(gè)國内大(dà)數據的(de)發展起到了(le)非常強的(de)促進作用(yòng)。
那我們反過來(lái)再看看國内的(de)情況。在2013年之前,大(dà)數據尚處在萌芽階段。中國人(rén)喜歡用(yòng)五年來(lái)設定一個(gè)周期。2013年-2017年12月(yuè)9日,爲什(shén)麽是這(zhè)個(gè)點呢(ne)?等會再跟你說。這(zhè)個(gè)時(shí)間,我們稱之爲“數據1.0時(shí)代”。這(zhè)個(gè)時(shí)代,我們認爲還(hái)是市場(chǎng)認知的(de)時(shí)代。這(zhè)個(gè)階段由于有一些資本的(de)加入,在行業裏有泡沫,就存在著(zhe)挂羊頭賣狗肉,所謂的(de)号稱是大(dà)數據的(de)企業。因爲有了(le)資本的(de)注入和(hé)驅動,當時(shí)整個(gè)行業技術出現了(le)很多(duō)創新,所以這(zhè)個(gè)時(shí)代是相對(duì)混亂的(de)時(shí)代。2016年下(xià)半年到2017年12月(yuè)9日之前,整個(gè)大(dà)數據産業都比較低迷。爲什(shén)麽是12月(yuè)9日呢(ne)?這(zhè)一天習(xí)大(dà)大(dà)召集了(le)七部委常委,梅宏院士發表了(le)一篇論文。當天習(xí)大(dà)大(dà)明(míng)确指出了(le),要以數據治國,在這(zhè)個(gè)一個(gè)場(chǎng)景提到了(le)數據的(de)應用(yòng)。這(zhè)樣一個(gè)時(shí)間點,對(duì)大(dà)數據這(zhè)個(gè)事情有了(le)非常明(míng)确的(de)政府導向性的(de)東西。這(zhè)樣的(de)情況下(xià),整個(gè)行業才逐漸恢複起來(lái)。如果從那個(gè)時(shí)間點來(lái)界定,也(yě)就是數據2.0時(shí)代。現在市場(chǎng)上提“大(dà)數據”的(de)企業不多(duō)了(le),大(dà)家提什(shén)麽呢(ne)?往“人(rén)工智能”、“深度學習(xí)”這(zhè)些方面來(lái)了(le)。從技術路徑來(lái)說,大(dà)數據這(zhè)個(gè)東西不複雜(zá)。大(dà)數據很大(dà),散落的(de)數據要通(tōng)過收集、傳輸、存儲、處理(lǐ)、分(fēn)析、檢索、挖掘、應用(yòng)等一系列環節來(lái)進行專業化(huà)處理(lǐ)。用(yòng)一句話(huà)來(lái)解釋,大(dà)數據的(de)本質就是一台機器幹不完的(de)事情,利用(yòng)多(duō)台機器同時(shí)完成。大(dà)數據需要雲計算(suàn)提供平台支撐算(suàn)力,雲計算(suàn)需要大(dà)數據進行落地應用(yòng)。所以這(zhè)兩者之間是你中有我、我中有你的(de)關系。
2.3人(rén)工智能
接下(xià)來(lái),我們再講講人(rén)工智能。
“人(rén)工智能”這(zhè)個(gè)詞也(yě)很熱(rè),現在标榜AI的(de)企業也(yě)很多(duō)。其實人(rén)工智能這(zhè)個(gè)事并不複雜(zá)。在很多(duō)年以前,就是人(rén)總是想自己變得(de)更舒适、更偷懶,所以就發布了(le)很多(duō)的(de)想法。一開始的(de)技術路徑,是教機器,就是人(rén)腦(nǎo)類機器。類機器是什(shén)麽意思?要把人(rén)的(de)思維教給機器。怎麽教呢(ne)?首先,教一些知識和(hé)算(suàn)法。這(zhè)裏面有一個(gè)故事很搞笑(xiào),是什(shén)麽呢(ne)?一開始叫推理(lǐ)能力,叫數據推理(lǐ),邏輯推論,因爲它有很強的(de)規則性,機器很容易學。反過來(lái)出現自然語言,有這(zhè)樣一個(gè)很搞笑(xiào)的(de)例子,如果你女(nǚ)朋友對(duì)你說“如果你早來(lái),我沒來(lái),你等著(zhe)”,“如果我早來(lái),你沒來(lái),你等著(zhe)。”機器就傻眼了(le),它不知道你要幹嗎。這(zhè)就是所謂NLP(自然語言處理(lǐ))的(de)解析問題。在美(měi)國NLP創業公司很多(duō),國内很少,爲什(shén)麽呢(ne)?這(zhè)個(gè)很難。第二個(gè)就是,邏輯學會了(le),機器得(de)教知識,但是一個(gè)很大(dà)的(de)問題,書(shū)面語可(kě)以,比如說“趙總,下(xià)午請您到什(shén)麽什(shén)麽地方。”有規則、有自定義的(de),那機器很容易學。但是你不能每次拿著(zhe)手機都說“趙總,您好!…”這(zhè)樣的(de),是不是大(dà)家都很别扭?所以在過去幾十年之中,證明(míng)這(zhè)種路徑,所謂的(de)人(rén)工智能不行,技術路線上行不通(tōng)。
那好,人(rén)都是聰明(míng)的(de),那幹什(shén)麽呢(ne)?就誕生了(le)神經網絡,神經元。什(shén)麽叫神經網絡?大(dà)家想象一下(xià),有一種非常神奇的(de)函數,這(zhè)個(gè)函數我也(yě)不知道長(cháng)什(shén)麽樣,但是我們每天固定輸入一個(gè)值的(de)時(shí)候,它可(kě)以輸出我希望得(de)到的(de)結果。如果這(zhè)個(gè)結果跟我輸入的(de)期望有相差的(de)時(shí)候,它可(kě)以自定義去調整。這(zhè)就是美(měi)國幾個(gè)哥(gē)們幹起來(lái)的(de),而且幹得(de)不錯,實現了(le)。但是你想象沒有,人(rén)的(de)大(dà)腦(nǎo)裏面有多(duō)少個(gè)神經元,太多(duō)了(le)。那這(zhè)些神經元想達到我期望值的(de)時(shí)候,離不開什(shén)麽?離不開數據。所以爲什(shén)麽說眼下(xià)的(de)人(rén)工智能在行業落地的(de)時(shí)候會非常麻煩呢(ne),因爲他(tā)缺少高(gāo)精度的(de)數據。可(kě)能有人(rén)感受得(de)到的(de),提得(de)最多(duō)的(de)AI是在醫療領域的(de)應用(yòng),但坦白來(lái)講,你去看病,拿CT片給醫生看,他(tā)隻能是讓人(rén)工醫療代替他(tā)30%-40%的(de)勞動力是可(kě)以的(de),完全交給機器,估計沒有哪一個(gè)醫生敢打保票(piào)說,就讓它看了(le),沒問題,這(zhè)個(gè)就過了(le)。他(tā)不敢。因爲什(shén)麽呢(ne)?精度不夠,這(zhè)是醫生的(de)職責所在,他(tā)不敢把這(zhè)個(gè)完全交給機器,要承擔責任的(de)。機器類人(rén)腦(nǎo)使得(de)機器擁有人(rén)心的(de)日子變得(de)不再漫長(cháng),諸多(duō)神經元需要大(dà)量的(de)數據作爲計算(suàn)支撐。未來(lái)再經過兩三年的(de)時(shí)間叠代,随著(zhe)我們更多(duō)的(de)數據源的(de)開放、流轉,這(zhè)個(gè)事情就會變得(de)不那麽複雜(zá)。
前面這(zhè)一段時(shí)間是給大(dà)家解析三個(gè)詞:雲計算(suàn)、大(dà)數據和(hé)人(rén)工智能,這(zhè)三者之間是你中有我,我中有你,誰都離不開誰。所以你會看到有些雲計算(suàn)廠商,他(tā)也(yě)有大(dà)數據平台,有些大(dà)數據平台的(de)企業做(zuò)著(zhe)做(zuò)著(zhe)他(tā)也(yě)會想我會調用(yòng)雲計算(suàn),有一些私有雲,或者公有雲的(de)廠商跟我合作;人(rén)工智能,現在爲什(shén)麽不提呢(ne)?現在市面上因爲資本的(de)熱(rè)點不在大(dà)數據本身,都在講人(rén)工智能。
3
投資邏輯和(hé)估值體系
前面是談一些概念。接下(xià)來(lái),我們再講一講投資邏輯跟估值體系。
3.1數據1.0:英雄輩出的(de)時(shí)代
我們還(hái)是回到定義來(lái)看吧。數據1.0時(shí)代,是一個(gè)英雄輩出的(de)時(shí)代。從産業的(de)角度來(lái)看,數據1.0時(shí)代的(de)時(shí)期它實現了(le)數據格式的(de)多(duō)樣化(huà):結構化(huà)數據、異構化(huà)數據和(hé)半結構數據。這(zhè)三種形式的(de)存在,導緻了(le)大(dà)量的(de)信息得(de)以被挖掘,規律得(de)以被總結,行業應用(yòng)變得(de)越來(lái)越樸實。而從投資的(de)角度來(lái)看,無非是三種:
一、傳統的(de)IT/系統集成商。傳統的(de)IT技術廠商因爲距離客戶較近,所以能夠理(lǐ)解客戶的(de)需求,但長(cháng)期的(de)系統集成廠商的(de)背景導緻他(tā)們往往有著(zhe)極強的(de)IT背景。現在轉換爲DT公司,往往形式大(dà)于内容,傳統的(de)IT集成的(de)整體估值,在轉換爲DT之後沒有3到5倍的(de)溢價,這(zhè)些創業公司自己都不好意思對(duì)投資人(rén)融資。這(zhè)些案例我們見到了(le)很多(duō)。後面有案例與大(dà)家分(fēn)享。如果真的(de)對(duì)他(tā)進行解剖,其實真的(de)什(shén)麽也(yě)不是。
二、擁有稀缺數據資源的(de)廠商。在數據1.0時(shí)代爲什(shén)麽會這(zhè)麽存在呢(ne)?中國是一個(gè)人(rén)情社會,有些企業,或者有些個(gè)人(rén),有某些渠道,他(tā)能獲得(de)政府授權的(de)一些公開數據,比如說像企查查、天眼查,工商所有的(de)數據,當然人(rén)家怎麽來(lái)的(de),也(yě)是通(tōng)過合規合法手段獲取這(zhè)些數據的(de)。不是說這(zhè)些人(rén)不行,在數據1.0時(shí)代,擁有數據者爲王。在過去五年,認爲,我有幾PB,或者有10PB數據,真厲害。因爲那是一種礦,我有了(le)這(zhè)個(gè)礦,我想怎麽挖、什(shén)麽時(shí)候挖,那是後面的(de)事情。
三、具備技術的(de)創業團隊。這(zhè)就在我們周圍,從中國的(de)大(dà)數據産業分(fēn)布來(lái)看,70%在北(běi)京,北(běi)京的(de)70%又在中關村(cūn)周圍,爲什(shén)麽呢(ne)?這(zhè)邊有北(běi)大(dà)、清華,一堆的(de)高(gāo)校創業者人(rén)才。
3.2數據1.0:差異化(huà)顯現的(de)時(shí)代
在數據1.0時(shí)代,這(zhè)三類企業是并存的(de)。第二個(gè)就是差異化(huà)顯現的(de)時(shí)代。
一、消費大(dà)數據。大(dà)數據很大(dà),如果我們把它分(fēn)門别類來(lái)看,我覺得(de)消費大(dà)數據是最快(kuài)的(de),爲什(shén)麽呢(ne)?因爲這(zhè)個(gè)領域非常簡單,運營商數據、互聯網數據比較容易獲得(de)。那個(gè)時(shí)候爬蟲還(hái)是比較新鮮的(de)一個(gè)技術,幾十個(gè)爬蟲互聯網上一爬,全網數據全拿下(xià)來(lái)。然後精準營銷,給客戶推。消費大(dà)數據裏面誕生了(le)一些很牛叉的(de)公司,這(zhè)個(gè)領域是最快(kuài)的(de),也(yě)是創業者最多(duō)的(de),因爲它有完整的(de)數據變現通(tōng)道,也(yě)有完整的(de)整個(gè)數據的(de)采集、歸納、整理(lǐ),到數據折現的(de)一個(gè)完整的(de)産業鏈。
二、機器大(dà)數據。我們講一個(gè)現實的(de)例子,所有的(de)企業裏都有一個(gè)信息化(huà)系統,但是信息化(huà)系統由誰來(lái)管?原來(lái)沒有雲的(de)時(shí)候,有一個(gè)所謂的(de)服務器,服務器在管理(lǐ)這(zhè)些運營商的(de)時(shí)候,它自己也(yě)會産生數據,也(yě)就是機器數據。也(yě)就是剛才美(měi)國第一家,也(yě)就是splank上市公司,它就是做(zuò)機器的(de)數據分(fēn)析的(de)。國内也(yě)有一家對(duì)标的(de)企業,活得(de)還(hái)好,但是這(zhè)個(gè)行業裏面也(yě)有大(dà)的(de)買家,像銀行、政府機關這(zhè)些可(kě)以去買,一般企業主不會,那壞就壞了(le),服務商能給我提供就行了(le)。
三、工業大(dà)數據。2016年以前處于萌芽階段。前幾年在這(zhè)個(gè)領域做(zuò)的(de)人(rén)很少,爲什(shén)麽呢(ne)?有兩個(gè)問題。第一,工業領域很零散,每個(gè)行業都不一樣;第二,缺人(rén)。缺什(shén)麽樣的(de)人(rén)?懂(dǒng)IT的(de)人(rén)不懂(dǒng)工業,懂(dǒng)工業的(de)人(rén)不懂(dǒng)IT、不懂(dǒng)大(dà)數據。因爲大(dà)家都盯著(zhe)消費大(dà)數據,爲什(shén)麽呢(ne)?跟銀行變現,跟金融體系去變現,那容易,高(gāo)大(dà)上,很快(kuài),數據也(yě)容易獲取,大(dà)家拼的(de)是技術。工業裏面,誰願意跑到工廠底層,高(gāo)溫設備廠商裏面去,你去到那裏看看,高(gāo)溫、潮濕、噪音(yīn)都來(lái)了(le),所以這(zhè)裏面的(de)人(rén)非常少;第二個(gè)呢(ne),工業裏面有一個(gè)非常緻命的(de)問題,它的(de)數據并發量不比“雙11”少,工業大(dà)數據設備連接越來(lái)越多(duō)的(de)時(shí)候,它是7×24小時(shí)的(de),所以這(zhè)裏面很難的(de)一個(gè)點,就是所謂的(de)時(shí)空數據庫,怎麽解決這(zhè)個(gè)點,現在市面上沒有比較好的(de)成熟的(de)案例。但是現在國家在提這(zhè)個(gè),所以這(zhè)個(gè)熱(rè)點可(kě)能在今年開始,以工業互聯上市爲主,前幾年可(kě)能比較沉默。說實話(huà),買它的(de)人(rén)不多(duō),因爲你要做(zuò)數據平台的(de)企業,可(kě)能在這(zhè)個(gè)行業裏面你的(de)産能都得(de)在100億以上,那這(zhè)樣的(de)企業央企比較多(duō)。如果沒有12月(yuè)9日一紙命令下(xià)來(lái),那你想想看這(zhè)個(gè)領域的(de)沉寂還(hái)是比較長(cháng)的(de)。但這(zhè)個(gè)事值得(de)幹,市場(chǎng)空間也(yě)大(dà),因爲這(zhè)裏面涉及的(de)東西比較多(duō)。首先,這(zhè)些散落在市場(chǎng)空間的(de)物(wù)理(lǐ)設備,你怎麽把數據采上來(lái)?這(zhè)第一個(gè)問題就已經難倒很多(duō)人(rén)。而設備廠商,到底是通(tōng)過無線WiFi傳輸,還(hái)是通(tōng)過4G的(de)網絡傳輸呢(ne)。這(zhè)裏面有很多(duō)的(de)技術手段要一點點的(de)去解決,而工業大(dà)數據隻是這(zhè)個(gè)産業鏈最終端皇冠上的(de)明(míng)珠,它要把數據反饋到現實應用(yòng)當中,而不是光(guāng)拿一些數據,沒有用(yòng)的(de)。
3.3行業市場(chǎng)
再講講市場(chǎng)吧,這(zhè)個(gè)大(dà)家都比較關注。爲什(shén)麽呢(ne)?因爲數據1.0時(shí)代有泡沫,而且泡沫不小。可(kě)能2014年7、8月(yuè)份之前,國内投大(dà)數據的(de)投資機構并不多(duō),可(kě)能也(yě)不會像今天有這(zhè)麽多(duō)人(rén),還(hái)是比較少的(de)。爲什(shén)麽呢(ne)?那時(shí)候整個(gè)行業、整個(gè)市場(chǎng)就那樣。直至2015年誕生了(le)一件比較好的(de)事情——新三闆。新三闆要有标的(de)物(wù),那這(zhè)個(gè)時(shí)候數據企業又是一個(gè)未來(lái)想象空間很大(dà)的(de),資本需要題材,這(zhè)樣大(dà)量的(de)資金在那個(gè)時(shí)間點瞬間注入了(le)進來(lái),所以對(duì)整個(gè)行業的(de)企業來(lái)說,急速的(de)推波助瀾。那這(zhè)個(gè)泡沫是什(shén)麽時(shí)候破的(de)呢(ne)?2016年。6月(yuè)1日《網絡安全法》,就是個(gè)人(rén)公民隐私身份這(zhè)個(gè)事。這(zhè)個(gè)《網絡安全法》嚴格到什(shén)麽程度呢(ne)?以前我們手機号碼是不算(suàn)你的(de)隐私的(de),那個(gè)時(shí)候也(yě)界定了(le)。《網絡安全法》的(de)公布有它的(de)必要,因爲在《網絡安全法》之前确實市面上的(de)黑(hēi)産的(de)數據比較多(duō),也(yě)比較猖狂。當然通(tōng)過這(zhè)個(gè)法律也(yě)有一些企業陸陸續續地踩到雷了(le),當然也(yě)很正常。但是可(kě)能也(yě)不像媒體所報道的(de)那樣,因爲這(zhè)個(gè)行業很新,在它發展過程當中,我們可(kě)能作爲投資人(rén)來(lái)看,還(hái)是要抱一個(gè)客觀的(de)心态來(lái)看。有些所謂的(de)信息大(dà)家都要經過篩選,真正的(de)如果說一些企業能夠達到某種高(gāo)度,這(zhè)種是不太可(kě)能的(de)。隻能這(zhè)麽去解釋這(zhè)個(gè)問題。整個(gè)行業急速下(xià)滑,爲什(shén)麽呢(ne)?包括政府也(yě)不知道我該不該花錢買。2017年12月(yuè)9日習(xí)主席開了(le)常委會,明(míng)确定出了(le)大(dà)數據這(zhè)個(gè)事還(hái)是值得(de)搞的(de),怎麽搞,我們不能隻談數據交易、數據資産流通(tōng)這(zhè)些,要把這(zhè)些數據應用(yòng)到智慧當中、應用(yòng)當中。
我在這(zhè)個(gè)過程中總結了(le)三個(gè)因素:1、政府是數據最大(dà)擁有者;2、政府也(yě)是數據庫最大(dà)購(gòu)買者。這(zhè)個(gè)是毫不避諱的(de),因爲他(tā)有數據,他(tā)不知道怎麽用(yòng)。他(tā)現在通(tōng)過服務的(de)方式,由這(zhè)些企業給他(tā)。當然剛才有朋友在提問,是不是應收賬款會比較長(cháng)?但你放心,政府不會賴你賬,這(zhè)是很正常的(de),可(kě)能隻是資金的(de)周轉問題;3、資本加速産業泡沫的(de)産生滅亡。整個(gè)過程中,咱們在座的(de)這(zhè)些資本有時(shí)候也(yě)沒幹好事,這(zhè)也(yě)是很正常的(de)事情,因爲沒有泡沫你就賺不到錢,有了(le)泡沫大(dà)家才能夠賺到這(zhè)些錢,這(zhè)是很現實的(de)問題。
3.4投資邏輯
接下(xià)來(lái)我們談談大(dà)數據産業的(de)投資邏輯。
你投數據,首先是要有數據資源。我們在數據資源層面,從數據的(de)獲取、整理(lǐ)、流通(tōng)、清洗四個(gè)環節布了(le)一些企業,圍繞整個(gè)數據源這(zhè)個(gè)頭上做(zuò)了(le)一些文章(zhāng),還(hái)有交易平台的(de)。有了(le)這(zhè)些數據以後,要有數據庫吧,國産有四大(dà)數據庫是吧。新的(de)所謂的(de)分(fēn)布式數據庫也(yě)不是全部通(tōng)吃(chī)的(de),新的(de)數據庫在不斷的(de)叠代,這(zhè)個(gè)肯定有一定的(de)機會。第二個(gè)就是數據的(de)檢索、數據調用(yòng),包括數據工具,這(zhè)裏面都有些機會的(de),這(zhè)裏面我們也(yě)投了(le)不少。包括虛拟技術,你也(yě)要去做(zuò)投資吧,做(zuò)投資你不能隻投一個(gè)點,你得(de)圍繞著(zhe)數據邏輯,構建自己的(de)數據生态。有了(le)這(zhè)些數據以後,解決了(le)它的(de)放的(de)問題,數據我要變現吧,不能空守著(zhe)一堆礦在那,我不挖也(yě)成不了(le)“富二代”,我要把它挖了(le)我才能成“富二代”。好,哪個(gè)行業可(kě)以去投?比如數據運營、數據支撐、數據應用(yòng)、行業應用(yòng),那我們有幸在13個(gè)領域,包括公安、部隊、交通(tōng)、金融、旅遊、智慧城(chéng)市等13個(gè)行業都投了(le)一些還(hái)算(suàn)不錯的(de)标的(de)物(wù),所以這(zhè)裏面是我們重點布局的(de)産業。那麽數據有了(le)以後,因爲數據是不可(kě)見的(de),一堆幹巴巴的(de)數字怎麽讓人(rén)看得(de)到呢(ne),那讓數據可(kě)視是一個(gè)大(dà)的(de)問題。這(zhè)個(gè)事做(zuò)起來(lái)容易,做(zuò)好了(le)難。做(zuò)起來(lái)容易什(shén)麽呢(ne),Excel的(de)方式,大(dà)家可(kě)以把數據很容易展示出來(lái),但是真正把它做(zuò)好了(le)就很難,因爲每個(gè)人(rén)的(de)設想都不一樣,有可(kě)能行業内需要大(dà)量的(de)定制。到目前爲止來(lái)看,還(hái)處在發展的(de)階段。但如果我們把人(rén)工智能加進來(lái),可(kě)以想像的(de)空間是很大(dà)的(de)。人(rén)工智能如果把它輸入進來(lái),根據個(gè)性進行調整,是可(kě)彈性的(de)展示,那就很厲害,這(zhè)時(shí)候對(duì)你技術方面的(de)要求會非常高(gāo)。
3.5估值體系
輕資産、重人(rén)力投資是大(dà)數據企業的(de)顯著特點。投資過程中,幾乎所有的(de)企業老闆都會對(duì)我們講,說我這(zhè)個(gè)是大(dà)數據,是最牛的(de)産業,我有最靠譜的(de)團隊、領先的(de)技術和(hé)稀缺的(de)資源。意思就是,你得(de)給我高(gāo)估值。那我們怎麽來(lái)看呢(ne)?如果按照(zhào)PE/PB/DCF通(tōng)用(yòng)财務模型來(lái)估的(de)話(huà),沒辦法估。爲什(shén)麽呢(ne)?它沒收入,或者收入很少。利潤的(de)話(huà),過去基本都很少,可(kě)能1000萬的(de)利潤,在市場(chǎng)就會要到6-7億,還(hái)可(kě)能更高(gāo)。但是你怎麽辦呢(ne)?你是不是不投?那這(zhè)個(gè)時(shí)候問題就來(lái)了(le),這(zhè)企業的(de)本質是什(shén)麽呢(ne)?一堆人(rén)、一堆電腦(nǎo),啥都沒有。怎麽辦呢(ne)?我覺得(de)可(kě)以從三點來(lái)看:
一、退出市場(chǎng)的(de)場(chǎng)景。你投大(dà)數據企業的(de)時(shí)候,有可(kě)能有些高(gāo)估值溢價的(de)時(shí)候,你想想看,我的(de)接盤俠是誰?傳導效應,VC後面的(de)PE,然後誰接呢(ne)?它不上市誰接呢(ne),沒人(rén)接,那就完了(le),我就進去了(le)。所以這(zhè)個(gè)邏輯要想好。
二、産品應用(yòng)的(de)場(chǎng)景。你就問這(zhè)個(gè)企業,你這(zhè)個(gè)産品到底解決什(shén)麽場(chǎng)景、解決什(shén)麽樣的(de)實際問題?我思考一個(gè)問題,我這(zhè)個(gè)場(chǎng)景能不能複制,如果能複制,那我可(kě)以給它比較高(gāo)的(de)一個(gè)溢價;如果不能複制,那麽我給的(de)價格肯定是要打個(gè)折的(de)。
三、要考慮一下(xià)基金的(de)整體布局。到底我是要搶占這(zhè)個(gè)制高(gāo)點,還(hái)是說我就是個(gè)打醬油的(de)。如果我是想搶占制高(gāo)點,有可(kě)能這(zhè)個(gè)項目在行業裏已經到了(le)B輪、C輪的(de)時(shí)候,我必須要投它,那這(zhè)時(shí)候對(duì)價格的(de)敏感度就稍微弱一點。假如我已經布了(le),雖然是我想投它,但這(zhè)個(gè)價格我承受不了(le),這(zhè)時(shí)候就要考慮你基金組合的(de)問題。
怎麽去估值呢(ne)?我們投的(de)這(zhè)30多(duō)家,很大(dà)一部分(fēn)都是撮合。說起來(lái)很玄乎,撮合什(shén)麽呢(ne)?你要10塊,那8塊行不行?不行。8塊5?不行,要9塊;差5毛,你看我有這(zhè)資源、有那資源,大(dà)家慢(màn)慢(màn)的(de)撮合下(xià)來(lái)。這(zhè)是第一個(gè)。那第二個(gè),就是參考标的(de)。這(zhè)個(gè)類型的(de)企業,比如這(zhè)個(gè)企業18個(gè)人(rén)、30個(gè)人(rén),他(tā)當時(shí)收入隻有500萬,還(hái)倒挂了(le)三四百萬。怎麽辦呢(ne)?一開始我投它1億,那類似的(de)企業後面來(lái)了(le),這(zhè)可(kě)能也(yě)就1億、1.5億之間。你不可(kě)能說你就比别人(rén)優秀。其實人(rén)都差不多(duō),你說你出身于IBM,Oracle,沒問題,我認,但是我要看整個(gè)産業,因爲現在是數據2.0時(shí)代,1.0時(shí)代的(de)時(shí)候有泡沫,我進去了(le)。那2.0時(shí)代要有産品的(de)應用(yòng),所以有參考的(de)标的(de)。
還(hái)要看它的(de)産品成熟度,投資方的(de)出發點,有些創業團隊的(de)産品還(hái)是個(gè)Demo,什(shén)麽都沒有,那時(shí)候你能給它高(gāo)估值嗎?所以對(duì)于輕資産、重人(rén)力資源的(de)大(dà)數據企業,在估值層面套用(yòng)市面上成熟的(de)商業模式,基本上在早期階段是不存在的(de)。到了(le)中後期以後怎麽辦呢(ne),那估值裏面最大(dà)的(de)問題,就是大(dà)家都參考PB。現在證監會發了(le)其他(tā)類企業上市标準,就是對(duì)收入有要求、對(duì)利潤沒要求,那麽很多(duō)做(zuò)PE的(de)就是參考你的(de)收入×PBS,這(zhè)種方式來(lái)給企業定價。這(zhè)樣會擠壓它的(de)空間,當然可(kě)以适當的(de),因爲PB的(de)倍數可(kě)以變,10-15倍,再加上銷售收入規模也(yě)可(kě)以變的(de)。企業提供的(de)是銷售收入,機構給的(de)是倍數PB,10倍、15倍,所以雙方有浮動的(de)空間在裏面,這(zhè)裏面就是雙方博弈的(de)價差。如果早期的(de)話(huà),坦白說,就是握手交易,我認可(kě)你,看你長(cháng)得(de)漂亮,那我就給你投錢,那1億、1.5億是沒有差異的(de)。
時(shí)間關系,今天我就給大(dà)家分(fēn)享這(zhè)麽多(duō)。謝謝!