圖為上海市新能源汽車(chē)公共數(shù)據(jù)采集與檢測(cè)研究中心主任丁曉華發(fā)表主題演講
根據(jù)國(guó)家的規(guī)定,新能源汽車(chē)在一個(gè)地方銷(xiāo)售時(shí),基于安全,需要進(jìn)行數(shù)據(jù)的監(jiān)管,上海數(shù)據(jù)中心就是這么一個(gè)機(jī)構(gòu)。目前數(shù)據(jù)中心采集的數(shù)據(jù)已經(jīng)有12萬(wàn)輛,包括了乘用車(chē)、客車(chē)、物流車(chē),還有非常少量的環(huán)衛(wèi)車(chē)。
我們采集的數(shù)據(jù)是根據(jù)國(guó)家標(biāo)準(zhǔn)來(lái)的,在此之前,我們是按照上海的標(biāo)準(zhǔn)來(lái)進(jìn)行采集,在上海制定標(biāo)準(zhǔn)之前,我們是向美國(guó)學(xué)習(xí)的。當(dāng)時(shí)科技部和美國(guó)能源部簽了一個(gè)上海和美國(guó)洛杉磯的電動(dòng)汽車(chē)數(shù)據(jù)交換的協(xié)議,美方主要是放在這里做,大概有15個(gè)數(shù)據(jù)。現(xiàn)在的數(shù)據(jù)采集包括整車(chē)狀態(tài),極值數(shù)據(jù)、位置數(shù)據(jù),這是我們平臺(tái)的基本架構(gòu)。我們的基礎(chǔ)數(shù)據(jù)層包括了幾塊,一塊是我們自己在做的潛在用戶的訪談數(shù)據(jù),也就是說(shuō)我們有一個(gè)試乘試駕中心,每年大約有4000個(gè)人來(lái)開(kāi)各種各樣的電動(dòng)汽車(chē),開(kāi)完以后填寫(xiě)一個(gè)訪談問(wèn)卷。第二部分,我們剛才講的根據(jù)國(guó)標(biāo)和地標(biāo)采集的實(shí)時(shí)數(shù)據(jù),12萬(wàn)輛。第三部分,每年所做的訪談數(shù)據(jù),因?yàn)閷?shí)時(shí)數(shù)據(jù)只能回答是什么,但是我們有很多不能回答為什么,訪談的問(wèn)卷能夠彌補(bǔ)這些缺陷。隨后我們?cè)僭黾恿艘恍┢渌臄?shù)據(jù),比如說(shuō)我們?cè)黾拥氖沁M(jìn)入上海的銷(xiāo)量數(shù)據(jù)以及用戶結(jié)構(gòu)數(shù)據(jù)等等,這些都要廠商給我們反饋。最后還有很多空間數(shù)據(jù)和路網(wǎng)數(shù)據(jù),我后面會(huì)講到我們一個(gè)最大的應(yīng)用。
從最終的應(yīng)用場(chǎng)景來(lái)看,我們主要包括了三方面,一個(gè)汽車(chē)行業(yè),包括行為和性能。我們正在和一些研究機(jī)構(gòu)合作基于電池的研究工作;還有服務(wù)行業(yè),比如我們主要在做的是電動(dòng)汽車(chē)共享。第三個(gè)就是交通行業(yè),因?yàn)槲覀?2萬(wàn)輛車(chē)的數(shù)據(jù)都是浮動(dòng)的,對(duì)交通行業(yè)的研究會(huì)有巨大的幫助。
我們數(shù)據(jù)采集更多的是把數(shù)據(jù)整理好,將來(lái)給更多的以及其他的機(jī)構(gòu),共同來(lái)研究,而不只是我們自己的研究。目前基于我們自己的一些研究,包括純電動(dòng)消費(fèi)者的出行特征,上海的情況和剛才北京所講的出租車(chē)區(qū)別很大,出租車(chē)的特征是我們的3倍,但不等于日均40公里就是消費(fèi)者認(rèn)為100公里就滿足了。
通過(guò)對(duì)消費(fèi)者出行里程的分布進(jìn)行采集,在PHEV的用戶上和訪談問(wèn)卷進(jìn)行比較,這兩個(gè)數(shù)據(jù)是比較接近的。通過(guò)數(shù)據(jù)采集,我們可以了解到用戶的充電特征:什么時(shí)候充,實(shí)際的充電時(shí)間是多長(zhǎng),還有充入的電量和充電時(shí)間分布等等。
還有對(duì)用戶的空間挖掘,我們采集的數(shù)據(jù)只有車(chē)輛的VIN碼,雖然沒(méi)有車(chē)牌,也不了解實(shí)際性能,但是因?yàn)橛蠫PS,所以我們可以挖掘出他們?cè)谀睦铮诰蜻@個(gè)目的不是為了私人的特征。大家知道,上海的消費(fèi)市場(chǎng)的特征是PHEV,如果PHEV的用戶不充電,他對(duì)我們國(guó)家的補(bǔ)貼政策不是正向作用,所以我們要知道他們是不是充電。所以首先要定位他們空間的物理位置,這樣我們對(duì)一個(gè)小區(qū)、一個(gè)小區(qū)就能分析這一個(gè)小區(qū)的充電概率,給政府提供很多的幫助。如果發(fā)現(xiàn)這個(gè)客戶白天是沒(méi)有固定的工作點(diǎn)的,那很有可能這個(gè)用戶就是把車(chē)輛拿來(lái)做運(yùn)營(yíng)了。
我們還有事后的監(jiān)管。一輛比亞迪唐,當(dāng)時(shí)燃燒了以后報(bào)告的情況是裝載了大功率車(chē)載冰箱,通過(guò)數(shù)據(jù)我們可以看到,實(shí)際情況是它的絕緣電阻變零了,其他的指標(biāo)是基本正常的,因此我們認(rèn)為廠商的結(jié)論基本是正確的,同時(shí)也可以看到,他的絕緣電阻之前已經(jīng)不正常了,所以利用這些數(shù)據(jù)其實(shí)我們還可以提前發(fā)現(xiàn)一些事故的苗頭。
我們同濟(jì)大學(xué)正在開(kāi)展一個(gè)電池健康狀態(tài)的研究,現(xiàn)在采集的幾個(gè)指標(biāo)都是我們能采到的數(shù)據(jù),后面的表征參數(shù)是慢慢的要進(jìn)行一些分析,通過(guò)一些時(shí)間比較,最終他們想做的是電池健康狀態(tài)。現(xiàn)在都在討論電池的梯次利用,如果在中期的時(shí)候,對(duì)電池的健康狀態(tài)如果有一個(gè)大致的評(píng)分的話,電池的梯次利用是不是就更簡(jiǎn)單一點(diǎn),這是當(dāng)這個(gè)課題研究的一個(gè)思想。
通過(guò)對(duì)一年的數(shù)據(jù)進(jìn)行初步的分析,可以看到這個(gè)單體電壓的正態(tài)分布發(fā)生了變化,這不等于我們結(jié)論就說(shuō)它有問(wèn)題了,而是說(shuō)數(shù)據(jù)發(fā)生了變化我們可看到了。第二,可以看到一些插電式混合動(dòng)力的總電壓平均最大值、平均最小值一年之中的變化,當(dāng)然它都是有條件的,是SOC大于95%的工況點(diǎn)的條件下,這都是剛剛在積累,我們希望通過(guò)這些數(shù)據(jù)不斷的去分析,來(lái)找到各種各樣的方法和評(píng)價(jià)的模型。
我們對(duì)時(shí)空分析也進(jìn)行了一些研究,將飛行圖和網(wǎng)點(diǎn)的運(yùn)營(yíng)圖進(jìn)行了分析,可以看到很粗的情況就是,網(wǎng)點(diǎn)的密度和它的營(yíng)業(yè)模式正相關(guān)。上海的上面是我崇明島,最上面是上海的一個(gè)遠(yuǎn)郊區(qū),可以說(shuō)密度很高,有了這種商業(yè)模式在空間上就能補(bǔ)充。右邊的圖可以看到上面這幅圖,最下面的時(shí)間,就是凌晨5、6點(diǎn)的時(shí)候他出行是很少的,但是從運(yùn)營(yíng)數(shù)據(jù)來(lái)看,他的用車(chē)時(shí)間又是很長(zhǎng)的,說(shuō)明什么?是時(shí)間補(bǔ)充,這個(gè)時(shí)段公交車(chē)還沒(méi)有、地鐵也沒(méi)有,其實(shí)需求還是有的,有了這種商業(yè)模式他在這個(gè)時(shí)間段就可以補(bǔ)充。
我們截取一個(gè)月的數(shù)據(jù),將所有在上海的3000多個(gè)營(yíng)業(yè)網(wǎng)點(diǎn),租賃的頻次進(jìn)行了分析。一種是從這里開(kāi)出去叫租賃,還有一個(gè)是還車(chē),一樣的概念,這里可以直觀的看到網(wǎng)點(diǎn)的運(yùn)營(yíng)度是差別很大的,有些網(wǎng)點(diǎn)效益很好,有些網(wǎng)點(diǎn)效益很差?;谶@樣的時(shí)空分析我們可以進(jìn)一步彌合其他曲線了,比如說(shuō)空間地理的POI信息、人口數(shù)據(jù)等等等等,這樣就能幫助這些企業(yè)做什么呢?為什么這些網(wǎng)點(diǎn)好,也就是提高他的運(yùn)營(yíng)效果。
我們還有基于交通的研究,如果把每個(gè)用戶的出行和道路網(wǎng)進(jìn)行匹配以后,就能產(chǎn)生很多的價(jià)值。每一個(gè)用戶的OD是有巨大的個(gè)人隱私的,我們是不能做的,但是如果把它的力度放寬,到4條路的塊或者交通調(diào)查小區(qū)的塊,或者說(shuō)一個(gè)街道,這樣的力度很多其他的機(jī)構(gòu)就可以按照他們的需要做研究了。每一個(gè)機(jī)構(gòu)有他自己的數(shù)據(jù)和他自己的模型,不可能將自己的數(shù)據(jù)和模型加入到你的數(shù)據(jù)中心力,所以剛才我就非常感興趣林總講的區(qū)塊鏈,如果基于這樣一種開(kāi)放的可追溯的話,那數(shù)據(jù)的開(kāi)放和應(yīng)用就具備了一些條件。
我們還基于熱力圖做了一些數(shù)據(jù)分析,通過(guò)對(duì)高峰特征和事故特征的綜合分析,能夠大致了解某一次事故出來(lái)以后,他這一個(gè)點(diǎn)、這一個(gè)時(shí)刻對(duì)整個(gè)上海交通產(chǎn)生了什么影響。之前一個(gè)城市的浮動(dòng)車(chē)主要是出租車(chē)或者EV,量是很小的,隨著電動(dòng)汽車(chē)的規(guī)?;瘧?yīng)用,我們就具備條件了,12萬(wàn)輛,公共交通很多、電動(dòng)汽車(chē)上也很多,傳統(tǒng)車(chē)堵他也堵,所以從這個(gè)角度分析他的交通特征他的意義就很大很大了。在進(jìn)行交通研究時(shí),我們把數(shù)據(jù)整理好,根據(jù)不同的場(chǎng)景、建立不同的模型,讓大家非常容易的來(lái)用它。
總的來(lái)講這么幾條,第一,每30秒一條的電動(dòng)車(chē)的數(shù)據(jù)已經(jīng)采了兩年12萬(wàn)輛,可以做很多的基礎(chǔ)研究了。第二,我們現(xiàn)在主要是三個(gè)場(chǎng)景,一個(gè)是消費(fèi)者的行為分析,幫助制造企業(yè)瓦解誰(shuí)是你的客戶。二是通過(guò)網(wǎng)點(diǎn)的施工分析,幫助這些企業(yè)洞察什么網(wǎng)點(diǎn)是好的,你如何去尋找好的網(wǎng)點(diǎn)。三是把這些出行的數(shù)據(jù)和道路的匹配,使得我們城市的交通管理更精細(xì)化,當(dāng)然對(duì)電池管理的研究我們剛剛開(kāi)始。還有一塊是千人計(jì)劃專家在牽頭的,就是基于大數(shù)據(jù),他什么都不講道理,就是把數(shù)據(jù)拿來(lái),如何建立模型,在這個(gè)模型上如何貼上他的標(biāo)簽,但這些工作才剛剛開(kāi)始,坦率的說(shuō)要初心結(jié)論的話可能還會(huì)比較漫長(zhǎng),但是希望我們這些數(shù)據(jù)能夠被更多的專輯也好,我們的企業(yè)也好來(lái)使用,挖掘他的價(jià)值。
(根據(jù)發(fā)言整理,未經(jīng)本人審閱)

