根據(jù)這些差異,NEI的構(gòu)成尤其需要注重勞動(dòng)力和技術(shù)投入指標(biāo)。除此之外,新經(jīng)濟(jì)人力資本密集的特點(diǎn)也需要企業(yè)在成長(zhǎng)初期有一個(gè)相對(duì)更長(zhǎng)的學(xué)習(xí)和積累。
在此基礎(chǔ)上,NEI指標(biāo)評(píng)價(jià)體系參考美國(guó)信息技術(shù)和創(chuàng)新基金會(huì)(ITIF)發(fā)布的《2014美國(guó)各州新經(jīng)濟(jì)指數(shù)》(2014 State New Economy Index)報(bào)告指標(biāo)體系、硅谷指數(shù)(Silicon Valley Index)等國(guó)際知名新經(jīng)濟(jì)和創(chuàng)新指數(shù)體系,結(jié)合中國(guó)經(jīng)濟(jì)發(fā)展特點(diǎn)和數(shù)聯(lián)銘品的數(shù)據(jù)優(yōu)勢(shì)制定了以下新經(jīng)濟(jì)指數(shù)的指標(biāo)體系。
NEI指標(biāo)體系共有高端勞動(dòng)力投入、優(yōu)質(zhì)資本投入與科技和創(chuàng)新三大類一級(jí)指標(biāo)(分別代表了新經(jīng)濟(jì)發(fā)展的勞動(dòng)力投入、資本投入、科技與創(chuàng)新投入)和11個(gè)二級(jí)指標(biāo)(表3)。這些指標(biāo)可以綜述為以下幾個(gè)方面:
1.高端勞動(dòng)力投入
高端勞動(dòng)力投入是新經(jīng)濟(jì)體系的基本特征。高端人才去哪了,哪個(gè)行業(yè)、哪個(gè)地方的經(jīng)濟(jì)就充滿了活力。“高端勞動(dòng)力投入”由“新經(jīng)濟(jì)企業(yè)崗位占總招聘崗位”、“新經(jīng)濟(jì)企業(yè)總薪酬占全部行業(yè)總薪酬”、“鐵路人口凈流入速度”、“航班人口凈流入速度”這4個(gè)二級(jí)指標(biāo)構(gòu)成。
2.優(yōu)質(zhì)資本投入
和人才一樣,資本流入的方向是經(jīng)濟(jì)發(fā)展的未來(lái)。外資是改革開(kāi)放以來(lái)帶動(dòng)中國(guó)“新經(jīng)濟(jì)”發(fā)展的重要力量。當(dāng)前風(fēng)險(xiǎn)投資市場(chǎng)也已日趨成熟,成為中國(guó)新經(jīng)濟(jì)發(fā)展的重要推動(dòng)力量。“資本投入”包括“新經(jīng)濟(jì)行業(yè)風(fēng)險(xiǎn)投資占總風(fēng)險(xiǎn)投資比例”、“新經(jīng)濟(jì)領(lǐng)域招標(biāo)比例”、“申請(qǐng)新三板新經(jīng)濟(jì)企業(yè)注冊(cè)資本占所有申請(qǐng)新三板企業(yè)總注冊(cè)資本比例”、“新經(jīng)濟(jì)行業(yè)新增公司注冊(cè)資本占所有行業(yè)新增公司總注冊(cè)資本比例”這4個(gè)二級(jí)指標(biāo)構(gòu)成。
3.科技與創(chuàng)新
創(chuàng)新能力是區(qū)域新經(jīng)濟(jì)發(fā)展的引擎,各企業(yè)的高級(jí)專業(yè)化人才、科學(xué)家和工程師的數(shù)量是創(chuàng)新的主體。我們通過(guò)一個(gè)區(qū)域的高級(jí)專業(yè)化人才數(shù)量、科學(xué)家和工程師保有情況及新增專利數(shù)量來(lái)衡量新經(jīng)濟(jì)的增長(zhǎng)在總經(jīng)濟(jì)增長(zhǎng)中的重要性,共包含“新經(jīng)濟(jì)雇傭的科學(xué)家與工程師占總體科學(xué)家和工程師的比例”、“適用于新經(jīng)濟(jì)的專利占總專利數(shù)量比例”和“適用于新經(jīng)濟(jì)的專利轉(zhuǎn)化占總專利轉(zhuǎn)化的比例”這三個(gè)指標(biāo)。
根據(jù)以上3個(gè)一級(jí)指標(biāo)和11個(gè)二級(jí)指標(biāo),NEI將產(chǎn)生兩大模塊的指數(shù)產(chǎn)品:1,時(shí)間縱比指數(shù);與2,區(qū)域橫比排序。時(shí)間縱比指數(shù)重點(diǎn)在于衡量各區(qū)域、各行業(yè)、各指標(biāo)隨時(shí)間的變化。區(qū)域橫比指數(shù)用于衡量同一時(shí)段不同區(qū)域的新經(jīng)濟(jì)綜合發(fā)展水平,重點(diǎn)在于區(qū)域?qū)Ρ龋l(fā)現(xiàn)各地的長(zhǎng)短板。
表3:新經(jīng)濟(jì)指數(shù)的指標(biāo)體系
三、獲取大數(shù)據(jù)
網(wǎng)絡(luò)公開(kāi)的大數(shù)據(jù)是NEI的基礎(chǔ)數(shù)據(jù)。在制作NEI的過(guò)程中,我們使用了大量數(shù)據(jù),包括企業(yè)網(wǎng)絡(luò)上的公開(kāi)招聘信息、新成立企業(yè)工商登記信息、風(fēng)險(xiǎn)投資數(shù)據(jù)、招標(biāo)投標(biāo)數(shù)據(jù)、三板上市數(shù)據(jù)、各類專利及專利轉(zhuǎn)化數(shù)據(jù)等。為了獲取準(zhǔn)確、客觀的新經(jīng)濟(jì)指數(shù),詳細(xì)討論各類企業(yè)行為的季度趨勢(shì),我們不僅會(huì)收集指數(shù)發(fā)布當(dāng)月的數(shù)據(jù),還會(huì)向前回溯,積累更多的歷史數(shù)據(jù)。
至今為止,NEI所用的累計(jì)數(shù)據(jù)包括5200余萬(wàn)條招聘信息、270萬(wàn)條新企業(yè)登記信息、376萬(wàn)條招標(biāo)/投標(biāo)數(shù)據(jù)、2.8萬(wàn)條風(fēng)險(xiǎn)投資數(shù)據(jù)、5000余條三板上市數(shù)據(jù)、580萬(wàn)條專利登記數(shù)據(jù)、30萬(wàn)條專利轉(zhuǎn)移數(shù)據(jù),另外還包括用以計(jì)算城市人口流動(dòng)信息的實(shí)時(shí)鐵路出票量數(shù)據(jù)、機(jī)場(chǎng)航班流量數(shù)據(jù)。全部合計(jì),我們的原始數(shù)據(jù)儲(chǔ)存總量已經(jīng)超過(guò)了100G。為了計(jì)算2015年8月至2016年2月這半年的指數(shù),我們產(chǎn)生的數(shù)據(jù)總量合計(jì)超過(guò)370G。
除了數(shù)據(jù)量龐大這一特點(diǎn)外,構(gòu)建新經(jīng)濟(jì)指數(shù)的數(shù)據(jù)還具有較好的全國(guó)代表性。其中,企業(yè)登記、招投標(biāo)、風(fēng)險(xiǎn)投資、三板上市、專利情況數(shù)據(jù)均為2015年七月以來(lái)全國(guó)所有可得數(shù)據(jù)。人口流動(dòng)數(shù)據(jù)囊括了所有的航班信息、列車運(yùn)行狀況;200公里以上的長(zhǎng)途客運(yùn)周轉(zhuǎn)量(人公里)和運(yùn)輸人次指標(biāo)中,我們的數(shù)據(jù)量占全國(guó)總數(shù)據(jù)量的74%。我們的招聘數(shù)據(jù)也包括了多家重要招聘網(wǎng)站的完整信息,從一、二千元每月的低技術(shù)崗位到50000元每月的高技能崗位,覆蓋全國(guó)各個(gè)行業(yè)。雖然有部分?jǐn)?shù)據(jù)沒(méi)有達(dá)到總體的規(guī)模,但是由于新經(jīng)濟(jì)指標(biāo)的構(gòu)建采用的是比例指標(biāo)而不是絕對(duì)值,這些指標(biāo)隨樣本數(shù)量多寡的變化很少。因此總體上,我們的數(shù)據(jù)覆蓋程度使構(gòu)建全面反應(yīng)我國(guó)新經(jīng)濟(jì)發(fā)展?fàn)顩r新經(jīng)濟(jì)指數(shù)成為可能。
為了在每個(gè)月的月初發(fā)布NEI,我們需要用到從上個(gè)月25日到前一個(gè)月26日,共一整個(gè)月的數(shù)據(jù)從原始數(shù)據(jù)開(kāi)始計(jì)算新經(jīng)濟(jì)指數(shù)。
四、行業(yè)識(shí)別
大數(shù)據(jù)的特點(diǎn)之一,是數(shù)據(jù)的龐雜性。我們手中的原始數(shù)據(jù),是一條條企業(yè)行為。例如,A企業(yè)在某招聘網(wǎng)站上發(fā)布了一條招聘信息,B企業(yè)獲得了1000萬(wàn)元的風(fēng)險(xiǎn)投資。為了讓離散的企業(yè)數(shù)據(jù)聚合產(chǎn)生價(jià)值,我們首先必須研究如何將這些企業(yè)聚類、合并。而聚類的最佳標(biāo)準(zhǔn)則是行業(yè)與地域。另一方面,新經(jīng)濟(jì)指數(shù)也要求我們將屬于“新經(jīng)濟(jì)”行業(yè)的企業(yè)進(jìn)行準(zhǔn)確的歸并。
地域信息的抽取相對(duì)容易,我們只需要識(shí)別企業(yè)名稱或者企業(yè)在其網(wǎng)站上的登記信息,絕大部分情況下都可以順利的識(shí)別出一個(gè)企業(yè)的準(zhǔn)確地址。但是識(shí)別行業(yè)則是一個(gè)較為復(fù)雜的過(guò)程。想象一下,當(dāng)人們看到一個(gè)企業(yè)的名稱時(shí),如何判斷其行業(yè)所在?一般來(lái)說(shuō),首先會(huì)觀察這個(gè)企業(yè)名稱是否包含某些關(guān)鍵詞。例如,包含“網(wǎng)絡(luò)”一詞的,一般屬于信息技術(shù)企業(yè),包括“能源”一詞的,可能是新能源企業(yè)。
人們將某些關(guān)鍵詞關(guān)聯(lián)到某個(gè)行業(yè),憑借的是經(jīng)驗(yàn)。但是,計(jì)算機(jī)并沒(méi)有這樣的經(jīng)驗(yàn),因此,我們首先需要讓計(jì)算機(jī)學(xué)會(huì)如何通過(guò)觀察一個(gè)企業(yè)的名稱來(lái)準(zhǔn)確判斷其行業(yè),具體過(guò)程如圖1所示。
第一步,我們必須找到合適的訓(xùn)練樣本。基于2013年工業(yè)普查數(shù)據(jù)與2008年的經(jīng)濟(jì)普查數(shù)據(jù)庫(kù),我們用企業(yè)名稱和詳細(xì)的行業(yè)信息(精確到四位數(shù)代碼),來(lái)訓(xùn)練企業(yè)名稱到行業(yè)的映射,但弱點(diǎn)在于,工業(yè)普查數(shù)據(jù)完全集中在制造業(yè),對(duì)計(jì)算機(jī)學(xué)習(xí)其他行業(yè)的企業(yè)名稱映射并無(wú)幫助;2008年經(jīng)濟(jì)普查的時(shí)間又太過(guò)久遠(yuǎn),對(duì)該指數(shù)所說(shuō)的“新經(jīng)濟(jì)”涵蓋不全。
因此,我們使用2015年全年的270萬(wàn)家新成立企業(yè)作為訓(xùn)練樣本,找到這些企業(yè)與行業(yè)之間的映射關(guān)系。映射的路徑為企業(yè)的經(jīng)營(yíng)范圍——《統(tǒng)計(jì)用產(chǎn)品分類目錄》——《國(guó)民經(jīng)濟(jì)行業(yè)分類》。最后,我們根據(jù)經(jīng)營(yíng)范圍映射成功的行業(yè)關(guān)鍵詞的個(gè)數(shù)以及出現(xiàn)順序,判定該企業(yè)的行業(yè)。
例如,當(dāng)我們?cè)谝粋(gè)企業(yè)的經(jīng)營(yíng)范圍中看到“電子血壓計(jì)”時(shí),可從《統(tǒng)計(jì)用產(chǎn)品分類目錄》查詢到其行業(yè)代碼3584。若同時(shí)有多個(gè)行業(yè)的關(guān)鍵詞被匹配到經(jīng)營(yíng)范圍中,則按照關(guān)鍵詞在文中的出現(xiàn)順序分別分配從大至小的一列權(quán)重后,加權(quán)計(jì)算該企業(yè)匹配到的行業(yè)總分來(lái)確定該企業(yè)的確切行業(yè)。

圖1:新經(jīng)濟(jì)指數(shù)指標(biāo)體系的行業(yè)識(shí)別
第二步,我們將這部分確定了行業(yè)的訓(xùn)練樣本取出,對(duì)其企業(yè)名稱進(jìn)行自然詞語(yǔ)分割,并以每個(gè)企業(yè)的名稱短語(yǔ)組合作為自變量,企業(yè)的實(shí)際行業(yè)作為因變量,進(jìn)行多元logit回歸。我們選擇了出現(xiàn)頻率在前200個(gè)的有意義短語(yǔ)(“有限”、“公司”等不具備實(shí)際行業(yè)信息的短語(yǔ)不包括在內(nèi))作為預(yù)測(cè)因變量,計(jì)算當(dāng)某些特定短語(yǔ)在企業(yè)名稱中出現(xiàn)時(shí),該企業(yè)落入某些特定行業(yè)的概率會(huì)出現(xiàn)怎樣的變動(dòng)。我們將經(jīng)過(guò)訓(xùn)練的識(shí)別程序引用到原有訓(xùn)練樣本上,并發(fā)現(xiàn)200個(gè)短語(yǔ)的行業(yè)判斷準(zhǔn)確度達(dá)到了95%左右,這使我們能夠有信心使用該程序來(lái)判斷其他企業(yè)的行業(yè)信息。
第三步,我們對(duì)所有企業(yè)都進(jìn)行分詞,同時(shí)應(yīng)用第二步算出的短語(yǔ)行業(yè)識(shí)別程序,計(jì)算每個(gè)企業(yè)的行業(yè)概率分布。為了保持預(yù)測(cè)的效率,避免帶有新詞語(yǔ)的企業(yè)無(wú)法被準(zhǔn)確判斷行業(yè),我們每個(gè)月度都將更新企業(yè)短語(yǔ)。
五、生成新經(jīng)濟(jì)指數(shù)
對(duì)企業(yè)的行業(yè)進(jìn)行準(zhǔn)確分類后,我們需要計(jì)算新經(jīng)濟(jì)行業(yè)企業(yè)在經(jīng)濟(jì)產(chǎn)出中的份額。首先,考慮一個(gè)一般的生產(chǎn)方程,其中K代表資本,H代表人力資本,A為技術(shù)水平,L則為勞動(dòng)力,w為各個(gè)要素投入的產(chǎn)出彈性。
假設(shè)每個(gè)要素中,有被投入新經(jīng)濟(jì),容易算出,當(dāng)資本中有的份額被投入新經(jīng)濟(jì),人力資本有的份額被投入新經(jīng)濟(jì),勞動(dòng)力有的份額被投入新經(jīng)濟(jì)時(shí),新經(jīng)濟(jì)占總經(jīng)濟(jì)產(chǎn)出的份額可表達(dá)為下式:
兩邊取對(duì)數(shù),可得:
當(dāng)我們將生產(chǎn)函數(shù)一般化,不僅只包括勞動(dòng)資本與技術(shù),而是包含更多二級(jí)指標(biāo)時(shí),每一個(gè)指標(biāo)的分權(quán)重會(huì)減小,使得上式中的對(duì)數(shù)符號(hào)去掉之后等式兩邊仍然近似成立,即得到下式:
六、新經(jīng)濟(jì)指數(shù)指標(biāo)權(quán)重的確定
確定新經(jīng)濟(jì)的指標(biāo)權(quán)重實(shí)際上等價(jià)于確定新經(jīng)濟(jì)行業(yè)各要素投入的產(chǎn)出彈性,實(shí)踐中包括兩種方案。
其一是經(jīng)驗(yàn)數(shù)據(jù)法,即根據(jù)國(guó)際經(jīng)驗(yàn)與歷史經(jīng)驗(yàn)首先判斷各個(gè)投入成份的產(chǎn)出占比大小。根據(jù)數(shù)據(jù),2014年中國(guó)第三產(chǎn)業(yè)的勞動(dòng)者報(bào)酬占增加值比重約為47.2%,具體到行業(yè),信息傳輸業(yè)的勞動(dòng)者報(bào)酬占比為23.4%、科學(xué)研究業(yè)的勞動(dòng)者報(bào)酬占比為49.7%。考慮到新經(jīng)濟(jì)行業(yè)是“以高質(zhì)量勞動(dòng)力為主要要素投入”的行業(yè),我們將勞動(dòng)者投入的權(quán)重定為接近上限的40%,對(duì)資本和技術(shù)則分別規(guī)定35%和25%的權(quán)重。同時(shí),所有二級(jí)指標(biāo)按簡(jiǎn)單算術(shù)平均合成相應(yīng)一級(jí)指數(shù)。經(jīng)驗(yàn)數(shù)據(jù)算法的優(yōu)勢(shì)在于我們將有一個(gè)具有理論框架的新經(jīng)濟(jì)指數(shù),如果未來(lái)有新的指標(biāo),我們可以將這些新的指標(biāo)納入全要素生產(chǎn)率、勞動(dòng)或者資本的一項(xiàng)中,進(jìn)行內(nèi)部權(quán)重微調(diào)。
但劣勢(shì)在于,如果新經(jīng)濟(jì)的發(fā)展十分迅速,各個(gè)部分的生產(chǎn)彈性變化很快,我們將不得不考慮大量變動(dòng)一級(jí)指標(biāo)權(quán)重。
其二是主成分分析法。主成分分析法的宗旨是依次找到經(jīng)濟(jì)投入這一矩陣的奇異值,即首先找到方差最大的那一組向量所對(duì)應(yīng)的奇異值,再找到方差次大的向量所對(duì)應(yīng)的奇異值,以此類推。主成分分析法的優(yōu)點(diǎn)在于他能夠以最小的信息量,對(duì)結(jié)果進(jìn)行最好的預(yù)測(cè),因此在預(yù)測(cè)效率上是最高的。但缺點(diǎn)在于,我們沒(méi)有一個(gè)合適的理論框架來(lái)闡釋我們的權(quán)重選擇,并且這樣的權(quán)重只是來(lái)源于歷史數(shù)據(jù)。問(wèn)題是在應(yīng)用到未來(lái)數(shù)據(jù)中去,如何選擇計(jì)算權(quán)重的歷史數(shù)據(jù),選擇哪個(gè)區(qū)間的歷史數(shù)據(jù),都較為隨意,使得整個(gè)新經(jīng)濟(jì)指數(shù)指標(biāo)體系的建立缺乏客觀性。
在綜合兩種算法的優(yōu)劣后,我們決定采用兩種算法的長(zhǎng)處,在初期采用經(jīng)驗(yàn)數(shù)據(jù)法,根據(jù)理論模型設(shè)置各指標(biāo)權(quán)重。未來(lái),則更多地使用主成分分析法,根據(jù)預(yù)測(cè)效果和歷史數(shù)據(jù)的變化,進(jìn)行權(quán)重微調(diào),以達(dá)到用指數(shù)來(lái)客觀觀察中國(guó)新經(jīng)濟(jì)發(fā)展情況的效果。
七、NEI的下一步
新經(jīng)濟(jì)將引領(lǐng)未來(lái)結(jié)構(gòu)調(diào)整的方向,是新常態(tài)下經(jīng)濟(jì)增長(zhǎng)的新熱點(diǎn)。新經(jīng)濟(jì)數(shù)據(jù),是衡量結(jié)構(gòu)調(diào)整步伐,判讀總體經(jīng)濟(jì)走勢(shì),把握投資機(jī)會(huì)的基礎(chǔ)材料。以大數(shù)據(jù)為基礎(chǔ)的新經(jīng)濟(jì)指數(shù),可以更加及時(shí)反映新經(jīng)濟(jì)變化快的特點(diǎn),更加適合網(wǎng)絡(luò)+時(shí)代的投資分析與決策。
NEI第一次可以較為清晰地展示新經(jīng)濟(jì)與舊經(jīng)濟(jì)之間的關(guān)系。新經(jīng)濟(jì)的快速成長(zhǎng)能否有效抵消舊經(jīng)濟(jì)下滑的壓力,是轉(zhuǎn)型與穩(wěn)增長(zhǎng)能否同步實(shí)現(xiàn)的關(guān)鍵。今天發(fā)布的新經(jīng)濟(jì)指數(shù)有助于我們理解新經(jīng)濟(jì)相對(duì)于舊經(jīng)濟(jì)的變化,舊經(jīng)濟(jì)過(guò)快調(diào)整或通過(guò)就業(yè)、收入和服務(wù)需求的渠道拖累新經(jīng)濟(jì),其影響的量級(jí)如何尚不得而知,NEI是跟蹤評(píng)估新經(jīng)濟(jì)變化的一個(gè)主要指標(biāo)。
NEI是一個(gè)詳實(shí)的指標(biāo)體系,一些細(xì)項(xiàng)指標(biāo)本身代表了新經(jīng)濟(jì)活動(dòng)的一個(gè)側(cè)面。大數(shù)據(jù)可以捕捉新金融和其他新業(yè)態(tài)的早期趨勢(shì),是互聯(lián)網(wǎng)時(shí)代資訊開(kāi)發(fā)的新渠道,更可以結(jié)合線下和傳統(tǒng)的統(tǒng)計(jì)數(shù)據(jù),勾畫出一幅更加完整、動(dòng)態(tài)的新經(jīng)濟(jì)圖像。
NEI還可以展示經(jīng)濟(jì)發(fā)展的地域差異,有利于政策的差異化和資源的優(yōu)化配置。在新經(jīng)濟(jì)指數(shù)的基礎(chǔ)上,可以對(duì)主要城市新經(jīng)濟(jì)活躍程度進(jìn)行排名。新經(jīng)濟(jì)發(fā)展或是繼工業(yè)化后人口跨地區(qū)流動(dòng)的重要方向標(biāo),結(jié)合人口出行大數(shù)據(jù),可以刻畫人口流動(dòng)熱力圖,指引消費(fèi)和服務(wù)業(yè)資源的跨區(qū)配置。
考慮到大數(shù)據(jù)的收集、清理以及參數(shù)的設(shè)定都需要時(shí)間來(lái)逐步完善,現(xiàn)發(fā)布試行版,待滿一年后重新評(píng)估調(diào)試后正式發(fā)布。正式發(fā)布的NEI將主要考慮以下幾個(gè)方面的變化:
(1)季節(jié)性因素的影響及調(diào)整。新經(jīng)濟(jì)活動(dòng)占比在很大程度上剔除了季節(jié)性因素的影響,但新經(jīng)濟(jì)活動(dòng)的季節(jié)性是否有異于傳統(tǒng)經(jīng)濟(jì),仍需要觀察。一些月度波動(dòng)較大的因素,需要通過(guò)移動(dòng)平均的方式進(jìn)行平滑處理。
(2)新經(jīng)濟(jì)行業(yè)需要不斷調(diào)適,更加準(zhǔn)確地反映產(chǎn)業(yè)升級(jí)和新業(yè)態(tài)的發(fā)展,力爭(zhēng)全面涵蓋新經(jīng)濟(jì)活動(dòng),準(zhǔn)確反映新經(jīng)濟(jì)的新趨勢(shì)。
(3)各子項(xiàng)因素的權(quán)重將逐步完善,根據(jù)歷史數(shù)據(jù),采用主成分分析法進(jìn)行調(diào)整。
【本文執(zhí)筆:陳沁,BBD Index首席經(jīng)濟(jì)學(xué)家;沈明高,財(cái)新智庫(kù)莫尼塔董事長(zhǎng)兼首席經(jīng)濟(jì)學(xué)家;沈艷,北京大學(xué)國(guó)家發(fā)展研究院教授、財(cái)智BBD新經(jīng)濟(jì)指數(shù)首席顧問(wèn)】