盡管在技術上需要更加精進,但行為識別已經開始走向一些場景。
根據中商產業研究院發布的《2019-2024年中國機器視覺行業前景及投資機會研究報告》顯示,2018年中國機器視覺市場規模首次超過100億元;而隨著行業技術提升、產品應用領域拓展,機器視覺市場將進一步擴大,預計在2019年機器視覺市場規模將近125億元。
的確CV(機器視覺)行業的市場規模不小、也有利可圖,但當技術產品紛紛成熟開始走向落地應用的時候,如何吃到這塊蛋糕,成為了眾多CV創企們所面臨的最大難題。與此同時,持續虧損、盈利壓力也在催促著每家CV企業努力“奔跑”。
趨視科技并不屬于CV領域最知名的行業,然而它們卻在落地應用和盈利上先人一步,其公司創始人徐飆表示:“如果行業內90%的企業都在虧損,我們則屬于另外那10%。”
它們是如何做到的呢
圖 | 趨視科技創始人徐飆
CV不僅有人臉識別,還有行為分析
談及CV,關注度和話題往往都集中于人臉識別領域,商湯、曠視等更是行業內外關注的焦點,但CV并不等同于人臉識別,它還包括行為識別。徐飆介紹,趨視科技在成立至今一直都瞄準的是行為識別。
“行為識別就是識別人類或者車的行為,比如人的打架行為、汽車闖紅燈行為等。雖然都屬于機器視覺,但人臉識別和行為識別是兩個技術、不同領域。”
技術層面,人臉識別通過一張照片就能完成,而行為識別則需要通過連續數據結合起來進行判斷,因為行為本身是一個連續動態的過程。簡而言之,人臉識別解決的是目標對象是誰的問題,而行為解決的是做了什么樣的事。目前行為識別往往用于司法管理、智慧門店、智能社區等場景。
徐飆告訴我們:“行為識別適用的領域非常多,但當前由于技術不夠成熟,面對太過復雜且并不標準的場景,行為識別技術很難發揮出很好的效果。所以該技術只能在一些垂直場景中先應用起來,慢慢地在應用過程中不斷的積累、提升技術,以此擴展到更多場景,最終滿足整個大范圍內人類對行為認知的要求。”
那么行為識別的技術難點究竟是什么呢?
由于行為是多樣化的話,它包括個體行為、群體行為,具體每個行為的表現方式也并不相同。比如打架行為和偷竊行為、一個人與一個人之間的打架和群體之間的打架行為等都全然不同,因此行為識別在數據采集層面就面臨很大的困難,其中主要涉及遮擋、錯位等問題。
同時人類看待世界的角度是三維的,而攝像頭采集到的畫面是二維,因此會造成視頻中有一個人露出了一只胳膊,但由于視頻無法采集到距離參數,所以遮擋、錯位的現象會讓AI算法難以判斷。
其次學習數據欠缺。眾所周知,許多AI技術依靠深度學習算法模型去訓練,這導致要讓AI實現行為識別,就必須先給行為下定義,讓AI知道行為是什么。然而前面已經提到行為非常復雜,甚至很多時候AI需要學習判斷的是負面行為,因此企業很難獲取到大量的學習數據。而算法模型沒有經過大量數據去訓練,也就很難“聰明”起來,從而在識別的效果和精度上難以達到用戶需求。
不過盡管在技術上需要更加精進,但行為識別已經開始走向一些場景。
CV企業破冰關鍵:規模化
徐飆介紹:“公司一開始關注的就是行業落地而非通用場景,且瞄準的第一個領域就是司法領域行業的管理,比如監獄管理,是否有犯人打斗、翻墻、攀爬等。這對于司法領域的管理而言是一個剛需,能夠降低人力管理成本,提升管理質量。”
而行業落地和通用場景落地兩條路徑的最大區別,在徐飆看來,前者能夠助力企業快速實現規模化落地,而這至關重要。
他談到:“所有CV廠商在近年來特別強調落地,本質上就是規模化落地,即企業在一個項目試點實現技術落地后能夠快速復制到下一個同類型的場景中,而不是做完一個試點,下一個場景再重新做一遍,這無疑增加了許多成本。”
對于企業而言,要實現規模化落地首先在最初尋找落地行業時,就要找到能夠實現規模化、可復制性強的場景。其中的關鍵在于,企業對于用戶核心訴求的把握是否精確。徐飆認為,CV企業要實現規模化必須了解用戶的需求,所謂需求指的不僅是用戶對于功能的需求,還包括用戶對性能當中準確度的要求。
“這需要碰撞。有些時候沒有人會告訴你他的需求和對準確度的要求是什么,企業往往需要通過試點、交流、反饋、修正......逐步形成一個行業共識,而并非單個客戶的需求。”
但即便把握了用戶需求和性能指標并不足夠,企業還要評估自身的技術體系、優勢能否滿足用戶的需求和指標。最后企業還要考慮實現規模化之后,是否會被競品取代,這要求其必須在技術落地應用過程中打造自身的技術門檻,如此廠商們才能率先占領市場,并在后續的競爭中獲勝。
回到趨視科技自身,徐飆談道:“公司明年的短期計劃,一方面是確保在司法行業實現規模化,創造更多的收益;同時也會將技術落地到智慧門店場景。小規模化帶給我們盈利,也驗證了技術已經達到可復制狀態,所以我們將會向更大的市場進行布局。”
【鎂客·請講】欄目 策劃&撰寫:溫暖
下一篇
安博會的喜與憂