瀚?;蛸R建奎:大數(shù)據(jù)存儲(chǔ)和分析依舊是基因測(cè)序的難題
stark 2016.07.09 22:34 大數(shù)據(jù)概念股
6月16日,“魔方大數(shù)據(jù)之——基因大數(shù)據(jù)產(chǎn)業(yè)應(yīng)用發(fā)展高層思享會(huì)”在上海貝殼社成功舉辦。超過70位國內(nèi)基因領(lǐng)域頂級(jí)專家及國內(nèi)外基因行業(yè)領(lǐng)袖企業(yè)代表共聚一堂,就基因大數(shù)據(jù)產(chǎn)業(yè)鏈各環(huán)節(jié)所面臨的機(jī)遇與挑戰(zhàn)進(jìn)行了深度探討。
本次活動(dòng)由上海大數(shù)據(jù)聯(lián)盟、數(shù)據(jù)猿主辦,貝殼社、上海市生物醫(yī)藥科技產(chǎn)業(yè)促進(jìn)中心、上海超級(jí)計(jì)算中心聯(lián)合主辦;得到上海市科技創(chuàng)業(yè)中心、上海市浦東新區(qū)科學(xué)委員會(huì)、上海眾創(chuàng)空間聯(lián)盟的大力支持。
以下是數(shù)據(jù)猿現(xiàn)場(chǎng)整理的“瀚?;蚨麻L賀建奎”的精彩分享:
賀建奎:非常感謝,也非常抱歉,由于飛機(jī)的原因,來的比較晚。我代表瀚?;?,來給大家介紹一下我們公司過去幾年的發(fā)展情況。
市場(chǎng)上第一個(gè)出現(xiàn)的,不一定是最后成功的
瀚?;?,2002年創(chuàng)辦,到現(xiàn)在已經(jīng)有幾年,我們主要從事基因測(cè)序儀的研發(fā)、生產(chǎn)和銷售。在國內(nèi),這并不算是主流業(yè)務(wù),因?yàn)闇y(cè)序儀屬于整個(gè)行業(yè)的上游。就我個(gè)人來看,現(xiàn)在做儀表面臨的挑戰(zhàn)主要有兩點(diǎn),其中我們比較關(guān)注的是高通量測(cè)序技術(shù),另一個(gè)是大數(shù)據(jù)的存儲(chǔ)和分析。
高通量的測(cè)序技術(shù)已經(jīng)發(fā)展了很長時(shí)間。1987年左右,自動(dòng)化測(cè)序技術(shù)出現(xiàn),產(chǎn)生第一代測(cè)序儀。2000年到2003年,二代測(cè)序儀推出。最先發(fā)明測(cè)序儀的人叫沃森寶,一個(gè)著名化學(xué)家。“第一個(gè)出現(xiàn)的不一定是市場(chǎng)上最后成功的”。后面的公司實(shí)施收購后吸取了第一家公司的經(jīng)驗(yàn),然后就在二代測(cè)序儀市場(chǎng)上占有了一定地位。
剛?cè)胄械娜?,你問他們用什么測(cè)序儀,他們可能只知道Illumina(第一代測(cè)序儀)。第三代測(cè)序是單分子測(cè)序,首先提出這個(gè)測(cè)序原理的是斯蒂文,他的公司2007年在美國納斯達(dá)克上市,但是到2008年還沒有開始銷售就遇到金融危機(jī),哪怕上市也融不到錢,后來賣了十幾臺(tái)試用機(jī),一臺(tái)150萬美元,最后在金融危機(jī)下公司做空,直接做到50美分就“掛了”。美國有一個(gè)規(guī)矩,一項(xiàng)技術(shù)原理發(fā)布到某一公司,公司產(chǎn)生上百項(xiàng)專利,一項(xiàng)專利孵化一家公司。為什么現(xiàn)在市面上的測(cè)序儀公司,美國就那么幾家,因?yàn)橹挥羞@幾條技術(shù)路線被開發(fā)出來。然后說說我們公司,是怎么來的呢?當(dāng)時(shí)我們?cè)诿绹茈y再做的更好,大家聊了很多,覺得失敗是大環(huán)境引起的,但前景還是好的,所以我們決定回國做測(cè)序。
2014年剛開始的時(shí)候,大家都不相信我們能做出來,尤其是我們這么年輕的人,如果國家找?guī)讉€(gè)院士來做可能靠譜一點(diǎn)。但幸運(yùn)的是,有好的技術(shù),就有好的成功方式,拿過來抄一下,這是過去十年來在中國比較成功的方法。當(dāng)然,我們不是從美國拿回來技術(shù)直接用,而是重新開發(fā),并得到了美國的支持。當(dāng)時(shí),大概有20個(gè)顧問,每月的顧問費(fèi)都要幾十萬,所以我們覺得必須要從源頭上拿到專利和人才。在深圳、上海,資本比較活躍,我們招來了最優(yōu)秀的人才,有十幾個(gè)博士,幾個(gè)海歸。
100美元做測(cè)序,這就是未來
測(cè)序儀這個(gè)行業(yè),跟大數(shù)據(jù)不一樣,大數(shù)據(jù)是瞬間爆發(fā)的,但做測(cè)序儀,通常是要五年才能做起來。做藥品要十年,做創(chuàng)新的醫(yī)療器械是五年,從開始研發(fā)到最后全面占領(lǐng)市場(chǎng),大概又五年時(shí)間。我們做這個(gè)事情的出發(fā)點(diǎn)在哪里呢?我們都知道測(cè)序儀便宜,越來越便宜。早在2003年測(cè)序儀就已經(jīng)形成了市場(chǎng),市場(chǎng)價(jià)是30億美元,后來美國非常有前瞻性的提出了一個(gè)理念,他們要實(shí)現(xiàn)1000美元做測(cè)序,于是資助了很多公司做技術(shù)做開發(fā),現(xiàn)在確實(shí)也接近1000美元了。
接下來,業(yè)界都在想,能不能100美元實(shí)現(xiàn)一個(gè)基因組測(cè)序?這是什么概念?1000美金,大部分的研究項(xiàng)目都可以測(cè)了,做研究嘛,不計(jì)較成本。任何一項(xiàng)新技術(shù),首先都要在科研里面廣泛使用,然后三四年后進(jìn)入臨床,在臨床爆發(fā)應(yīng)用。但在臨床1000美元的價(jià)格也還是太高,那么什么價(jià)格合適呢?最好是100美元。這樣每個(gè)人都可以做,普通人也能接受得了這價(jià)格。1000美元,一萬人或幾萬人做可能沒問題,但做到100美元,才屬于普通人、上億人都能做的測(cè)序。當(dāng)然,這不是現(xiàn)在能實(shí)現(xiàn)的,五年之后才能實(shí)現(xiàn)。100美元測(cè)序,將成為每個(gè)人都可以做的事,這就是未來。
第一代測(cè)序價(jià)格是30億美元,第二代是1000美元,一周時(shí)間可以測(cè),第三代我們還沒有實(shí)現(xiàn)。為什么第三代100美元就可以,而二代再怎么做都很難達(dá)到這一水平呢?這是因?yàn)樵平ㄔO(shè)。如果PCR是上百萬條,就需要大量的酶和試劑,耗材成本降下不去。第三代是單分子測(cè)序,可以從根本上降低成本。我們的任務(wù)是再過三五年,微量測(cè)序就是100美元的水平,這個(gè)目標(biāo)只有第三代測(cè)序能實(shí)現(xiàn)?;氐轿覀兊漠a(chǎn)品,單分子測(cè)序平臺(tái),我們叫GenoCare,Care是關(guān)照的意思,現(xiàn)在已經(jīng)逐漸從科研領(lǐng)域轉(zhuǎn)向臨床。在座的可以看到,三四年前是測(cè)基因組最黃金的時(shí)代,現(xiàn)在做一萬個(gè)才有可能發(fā)現(xiàn)一個(gè)。這個(gè)基因測(cè)序的技術(shù),跟所有的技術(shù)一樣,在科研領(lǐng)域的應(yīng)用是四五年以后,之后是臨床應(yīng)用,也是未來市場(chǎng)爆發(fā)的階段。斯蒂文我很熟。2013年以前,他公司的市值是200億美金,大家覺得他太牛了,但是后來發(fā)現(xiàn),他的產(chǎn)品并沒有在臨床上應(yīng)用。不能走到臨床,就無法獲得價(jià)值,這就是為什么被收購的原因?二代測(cè)序,或者三代測(cè)序,開始做的時(shí)候都有憂慮,但現(xiàn)在考慮這些是多余的,因?yàn)樗_實(shí)可以用于臨床,第三代是有持久發(fā)展前景的,會(huì)帶來一段時(shí)間的繁榮。
這是我們做的測(cè)序儀,因?yàn)樯虡I(yè)原因,展示的不是最后的產(chǎn)品,最終的設(shè)計(jì)10月才會(huì)公布,是我們?cè)谏弦淮A(chǔ)上進(jìn)一步設(shè)計(jì)的。三代測(cè)序儀拿過來就可以測(cè),這是我們提供的解決方案,可以直接拿報(bào)告。去年10月,我們第一次做出樣機(jī),今年4月,做了第二批產(chǎn)品,還辦了一個(gè)鑒定會(huì),專門刊發(fā)兩頁文章報(bào)道這事。我們一直堅(jiān)信只有最好的科學(xué),才能有最好的公司,最好的產(chǎn)品。
這項(xiàng)技術(shù)到底有什么特點(diǎn)呢?可以做定位靶向測(cè)序。我們生產(chǎn)的測(cè)序儀上帶有十個(gè)基因探針,測(cè)出的結(jié)果是一步式靶向測(cè)序;我們用的化學(xué)體系和Illumina完全不同,測(cè)序全程只用2種酶,而Illumina需6種酶。二代測(cè)序時(shí)間非常長,而三代測(cè)序第二天可以拿到結(jié)果,不僅時(shí)間短,還不需要PCR,解決了實(shí)驗(yàn)室建庫成本高且使用者操作難度大的問題。PCR污染一直是臨床試驗(yàn)一個(gè)非常頭痛的問題,為了杜絕PCR污染,我們做了很多努力,現(xiàn)在它可以廣泛的應(yīng)用在很多地方。這是陳潤生院士。我們做出來的產(chǎn)品跟專家們講,他們都很高興。
數(shù)據(jù)不標(biāo)準(zhǔn),很難被再次挖掘
實(shí)際上我們正緊鑼密鼓準(zhǔn)備做云計(jì)算平臺(tái),這是什么意思?首先,現(xiàn)在產(chǎn)生的大量數(shù)據(jù)專注在基因組方面,我相信未來基因組領(lǐng)域里的數(shù)據(jù)量比現(xiàn)在想象的規(guī)模還要大很多。不知道大家有沒有看過美國NCBI(美國國立生物技術(shù)信息中心)數(shù)據(jù),化學(xué)類文章發(fā)表之后,通常會(huì)上傳到文庫,所以那上面收集了海量的基因組數(shù)據(jù),一直是以指數(shù)級(jí)增長。那么為什么已經(jīng)有這么多數(shù)據(jù),還會(huì)有那么多公司自己收集數(shù)據(jù)呢?
一個(gè)基本的觀點(diǎn)是,這些數(shù)據(jù)雖然多但不能用。做數(shù)據(jù)分析的有一個(gè)認(rèn)知,“垃圾放進(jìn)去,出來的也還是垃圾”,你要做一個(gè)好的分析,但數(shù)據(jù)來源是垃圾的話,出來的東西肯定也是垃圾。大數(shù)據(jù)是全世界各個(gè)國家提交的,零散、碎片化、沒有標(biāo)準(zhǔn),但是有量。如果不是統(tǒng)一的方法做出來,要進(jìn)一步分析基本不可能。雖然數(shù)據(jù)多,但能用的真的非常少。沒有標(biāo)準(zhǔn)的數(shù)據(jù),不具備挖掘可能性,也可以說很難再被挖掘。再來看數(shù)據(jù)的統(tǒng)計(jì)或分析,數(shù)據(jù)越來越多,那又是什么限制了目前行業(yè)的發(fā)展?網(wǎng)速、帶寬。無論你在哪里測(cè),都要把數(shù)據(jù)寄回來?,F(xiàn)在各地都可以買測(cè)序儀,每家醫(yī)院都想買一臺(tái),測(cè)序儀已經(jīng)進(jìn)入了平民化時(shí)代,跟早年高大上的“形象”不一樣了。幾百萬的測(cè)序儀,對(duì)很多醫(yī)院來說,不是特別大的儀器。不過,很多地方想買測(cè)序儀,面臨的困難是不僅需要有專人管理,還有再買一個(gè)服務(wù)器,除了要收集信息,數(shù)據(jù)處理方面也要有諸多投入。所以,云計(jì)算是未來趨勢(shì)。未來的測(cè)序不只是化學(xué)的,還是生物學(xué)的,只有這樣才能產(chǎn)生更深遠(yuǎn)的影響,影響這個(gè)社會(huì),影響健康產(chǎn)業(yè)。
大家花一百萬買個(gè)機(jī)器,又要買服務(wù)器,還要有人照顧,價(jià)格估計(jì)就要翻一番。該怎么辦呢? 這就是我們想解決的事。測(cè)序儀做出來之后,五年之內(nèi)全國所有三甲醫(yī)院,CPC總數(shù)達(dá)到上千臺(tái),每一臺(tái)都可以直接插網(wǎng)線,無論是在北京、上海、武漢、云南、深圳還是其它地方,測(cè)序過程中把所有數(shù)據(jù)自動(dòng)上傳到我們的Space上,意味著醫(yī)院無需再花幾十萬做這件事。一天幾千臺(tái)測(cè)序儀同步上傳,這是一個(gè)很大的數(shù)據(jù)存量。
那么分析該怎么做?我們提供的解決方案是,數(shù)據(jù)全部上傳后,我們自己或者與他人合作開發(fā)APP,測(cè)試的時(shí)候點(diǎn)一下,自動(dòng)化分析報(bào)告就能出來,包括標(biāo)準(zhǔn)化的400個(gè)分析,有PGS的,也有常見疾病的。我舉的例子很少,因?yàn)槲覀冎蛔隽藥讉€(gè),但我覺得可以做幾百個(gè),我們希望通過合作把這個(gè)事情做起來。從用戶的角度來看,不需要買服務(wù)器,不需要有專門的人做這事,只要完成這個(gè)測(cè)試,用非常簡單的方式得到結(jié)果。其實(shí)醫(yī)生并不想知道生物學(xué)的一些事情,他們只想知道數(shù)據(jù)的分析結(jié)果是什么,究竟這個(gè)病人到底有沒有病。
大數(shù)據(jù)概念股:東方國信、易華錄、拓爾思、銀之杰、東方網(wǎng)力、天璣科技、科華恒盛、宜通世紀(jì)、榮之聯(lián)、紫光股份、海蘭信、創(chuàng)意信息。
大數(shù)據(jù)概念股
那么問題來了:最值得配置的大數(shù)據(jù)概念股是哪只?即刻申請(qǐng)進(jìn)入國內(nèi)首個(gè)免費(fèi)的非公開主題投資交流社區(qū)概念股論壇參與討論!
申明:本文為作者投稿或轉(zhuǎn)載,在概念股網(wǎng) http://www.guangshenggb.com/ 上發(fā)表,為其獨(dú)立觀點(diǎn)。不代表本網(wǎng)立場(chǎng),不代表本網(wǎng)贊同其觀點(diǎn),亦不對(duì)其真實(shí)性負(fù)責(zé),投資決策請(qǐng)建立在獨(dú)立思考之上。