新一代的“谷歌”也許是依靠計算機視覺來實現(xiàn)搜索的公司
matthew 2016.11.15 08:45 計算機視覺概念股
看似簡單的應(yīng)用,背后包含了復(fù)雜的技術(shù)。對于戶外環(huán)境中建筑、店面的識別,一直是計算機視覺的難點。如何讓計算機看清楚,看得準?即使戶外的光線千變?nèi)f化,即使環(huán)境中存在眾多干擾因素?
帶著這些問題,硅谷密探連線了Alice Who的開發(fā)者,以色列創(chuàng)新公司Fringefy的聯(lián)合創(chuàng)始人Assif Ziv,請他介紹了Fringefy在計算機視覺技術(shù)領(lǐng)域的研發(fā)情況,以及Fringefy的愿景和方向。
獨辟蹊徑的計算機視覺技術(shù)
計算機視覺(Computer Vision)是近年來大家談的較多的話題。無人駕駛汽車、無人機等產(chǎn)品漸漸進入大眾視野,如何讓機器能夠像人一樣,有看見、辨識周圍環(huán)境的能力,成為這些產(chǎn)品成功的關(guān)鍵。
隨著計算機視覺技術(shù)的發(fā)展,人們開發(fā)了不同的手段來幫助機器“看見”物體。大部分技術(shù)是基于同一基礎(chǔ)的,那就是點狀云(Point Cloud)。通過3D掃描物體,構(gòu)建點狀云,然后用點狀云訓(xùn)練機器的算法,讓機器能夠辨識出這個物體。
?
但是,這種標(biāo)準的技術(shù),在室內(nèi)適用,識別物體、人臉都很給力,卻不擅長識別戶外建筑。在戶外,隨著光線的變化,不但建筑反光的顏色和強度會變化,陰影會變化;此外,建筑物周圍的行人、??康能囕v,也會影響機器對其的識別。
舉個例子,我們在上午10點拍攝的咖啡的圖像,與下午4點再次拍攝的圖像,對于機器識別來講,可能是完全不同的兩個場景。并且,建筑物的體積較大,人通常并不能拍到其全貌。這也給機器識別帶來了挑戰(zhàn)。
而Fringefy的計算機視覺技術(shù)主要集中于應(yīng)對這些挑戰(zhàn)。Fringefy所開發(fā)的算法,專注于把握建筑的幾何形狀,而非整體和細節(jié)。也就是說,通過把握建筑的門、窗及主要結(jié)構(gòu),避開光線和干擾物的影響。
Azzif的團隊已經(jīng)專注開發(fā)這個技術(shù)兩年,并在美國申請了專利,成為同一領(lǐng)域的最前沿的公司。
首先,他們的商業(yè)模式是什么?
其實,“Alice Who”APP只是Fringefy推出的一款展示用APP。Fringefy真正的商業(yè)模式,是通過提供API或SDK為客戶提供服務(wù)。
目前,F(xiàn)ringefy的目標(biāo)客戶包含三類。
第一類是地區(qū)搜索引擎,如Yelp、大眾點評、Trip Advisor等,讓這些搜索引擎的用戶,能夠非常簡便的用手機攝像頭識別周圍環(huán)境,提供不一樣的搜索體驗。
Fringefy的第二類目標(biāo)客戶是品牌和公司,這些公司希望通過分析其用戶在社交媒體上發(fā)布的照片的地理位置,來獲得商業(yè)洞察。例如,這些公司的用戶,通過社交媒體發(fā)布了自己的照片,但并沒有注明拍攝地址。Fringefy可以幫助客戶分析這個圖片,告訴客戶,這是什么地方,從而幫助客戶分析其用戶的行為模式和喜好。
而第三類,當(dāng)然是國防和安全行業(yè)了。以色列政府目前也是Fringefy的合作伙伴之一。
Azzif告訴硅谷密探,F(xiàn)ringefy成立到現(xiàn)在,盈利模式也經(jīng)歷了多個變化。最先是希望通過授權(quán)技術(shù)給客戶來盈利,例如收取年度授權(quán)費用。后來,逐漸轉(zhuǎn)向提供API,基于客戶所消費的圖像分析服務(wù)的數(shù)量和需求來收費。
如何快速準確地進行圖片識別?
通常,F(xiàn)ringefy會把用戶通過手機攝像頭捕捉到的圖像,與數(shù)據(jù)庫中的圖像進行比較、匹配。那么,如何將一個圖像,與云上的成千上萬張圖像比較, 并且快速、精準?背后的兩個關(guān)鍵詞是:數(shù)據(jù)庫和標(biāo)簽策略。
Fringefy的數(shù)據(jù)庫來源分為兩類。對于一些客戶,例如國防安全類的,客戶會負責(zé)提供圖像數(shù)據(jù)庫。但是Fringefy也能夠自己抓取公開網(wǎng)絡(luò)上的圖像,快速形成圖像數(shù)據(jù)庫,例如,Yelp,Trip Advisor等網(wǎng)站上,有用戶上傳的大量圖片,包含了建筑外觀,并有相應(yīng)的地點信息。
在制作“Alice Who”APP時,F(xiàn)ringefy建立了整個舊金山的商業(yè)類建筑的數(shù)據(jù)庫,包括所有的餐廳、酒吧等,只用了2到3天的時間。目前,這個公開網(wǎng)絡(luò)數(shù)據(jù)抓取的能力,還不是全自動的。Fringefy的下一步,就是研發(fā)能全自動的從浩瀚的網(wǎng)頁上抓取圖像,形成數(shù)據(jù)庫的解決方案。
不過,如果每次都要將一個圖像與云上的成千上萬張圖像比較、匹配,可能會減緩識別的速度。所以Fringefy配合使用了標(biāo)簽(signature)策略,讓計算機算法根據(jù)某類標(biāo)簽,先進行預(yù)篩選,然后再匹配識別,以配合現(xiàn)有的電腦處理的條件。
例如,地址可以作為一種標(biāo)簽。當(dāng)用戶在某一個地點用攝像頭捕捉圖像時,用戶的手機會上傳地理位置信息。Fringefy就能根據(jù)這個地理位置信息,先篩選出數(shù)據(jù)庫里附近的建筑的圖像,再與用戶手機捕捉到的圖像進行匹配,從而更快、更準的得到結(jié)果。
計算機視覺概念股:大恒科技、漢王科技、萬訊自控、永創(chuàng)智能、勁拓股份。
計算機視覺概念股
那么問題來了:最值得配置的計算機視覺概念股是哪只?即刻申請進入國內(nèi)首個免費的非公開主題投資交流社區(qū)概念股論壇參與討論!
申明:本文為作者投稿或轉(zhuǎn)載,在概念股網(wǎng) http://www.guangshenggb.com/ 上發(fā)表,為其獨立觀點。不代表本網(wǎng)立場,不代表本網(wǎng)贊同其觀點,亦不對其真實性負責(zé),投資決策請建立在獨立思考之上。