97.1%,千視通Re-ID跨鏡追蹤行人再識别技術刷新多項行業紀錄!

發表時間:2018-10-31 10:10

日前,從主打原創人工智能算法與視頻深度學習技術的千視通獲悉,其最新的行人再識别跨鏡追蹤技術(Re-ID)在國家超算中心長沙中心完成了精度測試,測試結果刷新了目前已知的業内最高紀錄。

作為一家以Re-ID視頻結構化技術和應用為核心的計算機視覺科技公司,千視通團隊在Market 1501、DukeMTMC-reID、CUHK03這三個衡量Re-ID技術最通用的數據集測試中,獲得了巨大突破。這些數據集中有兩項核心指标評判标準:首位命中率(Rank-1 Accuracy)以及平均精度均值(Mean Average Precision,縮寫mAP,它反映檢索的人在底庫中的所有圖片排在結果隊列前面的程度)。

千視通目前在Market 1501上的首位命中率(Rank-1 Accuracy)已經達到97.1%,超越人眼識别能力(94%),領先頭部廠家,并刷新了今年4月公布的96.6%的世界紀錄。同時在CUHK03,Duke MTMC-reID兩個數據集上也刷新了之前業内最高紀錄,達到了行業state of the art的技術水平,特别是在CUHK03數據集上,Rank 1指标提高了10.7%。

Market 1501:由清華大學提供 ,使用了6個攝像頭(5高清和1低清),鏡頭之間有部份重疊,當中有 1501個人的身份,共有32668個标物框/行人圖片。千視通在最新的測試報告中顯示,該數據集中首位命中率高達97.1%(籃框代表正确目标,紅框代表誤報或不清晰目标)。

(千視通Market1501 部分測試結果)

Duke MTMC-reID:格式基本上跟 Market 1501一樣,共有1404個人的身份,并 36411個标物框/行人圖片。DukeMTMC其實不止有Re-ID用的訓練及測試素材,它本來是用于視頻之間的(真正)多攝像頭多軌迹動态追蹤。用來訓練或測試 Re-ID,隻是它的其中一個功能。千視通在Duke MTMC-reID數據集中測試的mAP結果78.9%,刷新之前榜單第一的78.4%,而Rank1成績為89.1%,超過之前第一名88.7%。

(千視通Duke MTMC-ReID 部分測試結果)

CUHK03: 是香港中文大學所提供的。它前身有CUHK01 和CUHK02,因為這兩個數據庫不夠作深度學習訓練,所以采集了更多數據生成 CUHK03。這個數據庫有1360個人的身份,并有 13164張圖片,同樣由6個攝像頭所拍攝。千視通在該數據集中測試的mAP結果為74.8%,遠遠超過原先排行第一的67.4%數據,而Rank1更是達到78.7%,比之前榜首的68%提升了足足10.7%。

(千視通CUHK03 部分測試結果)

以上數據由國家超級計算長沙中心,以及長沙市公安局刑事偵查支隊視頻偵查大隊測試驗證。

自研技術創新,千視通Re-ID算法有效提高可識别率

Re-identification,簡稱Re-ID,即行人再識别,是利用計算機視覺技術判斷圖像或者視頻序列中是否存在特定行人的技術。作為人臉識别技術的重要補充,其發展内核便是在不同視頻中,在無法獲取清晰人臉特征信息前提下,機器通過穿着、發型、體态等信息将同一個人識别出來,增強數據的時空連接性。可廣泛應用于智能視頻監控、智能安保等領域。

舉個例子,我們所熟悉的哈利·波特作品,在《阿茲卡班囚徒》中想象出一種叫做活點地圖 (Marauder’s Map)的魔法道具,展開地圖,除了顯示基本地圖信息外,還能實時觀看某個指定人物的行動軌迹。

回到現實世界,我們現在可以在攝像頭的部署環境中,通過上傳特定人物的照片,同時檢測多個不同位置的攝像頭數據,精準找出所有攝像頭抓拍到的目标人物圖像,并生成他/她的行動時空軌迹,達到跨鏡追蹤的目的。

由于多個攝像頭下拍攝行人的角度、光線等條件不同,圖像中的行人很難被判斷為同一個人。所以就要找到行人上的局部不變的部分,比如:衣服顔色,衣服紋理,手提包,背包等。同時行人兼具剛性和柔性的特性 ,外觀易受穿着、尺度、遮擋、姿态和視角等影響,行人再識别是一個既具研究價值同時又極富挑戰性的課題,為了提升Re-ID的可識别率,千視通做了多方面的算法優化,緻力于加速Re-ID的應用落地。

·考慮訊息全面:一般算法隻考慮了全局、多粒度及水平彙集訊息,而水平彙集訊息主要用于把圖片對齊。在實際的情況下,攝像頭的角度多變,同時人行是非剛體,所以,垂直方向也理應同時考慮。對于此種情況,千視通在網絡設計上開發了自研的垂直彙集及其關聯的算法層,用以更好的适應以上情況。

·強化特征空間的可分辨性: 千視通的 ReID 算法,針對損失函數進行改良,并提出了新的方案,能一方面增大類間距離并同時最細化類内距離。這代表能提高所計算出的高維特征向量的唯一性,并能有效的提高可識别率。

千視通卡視聯動技戰法,Re-ID+人臉識别助力高效辦案

提到計算機視覺領域的大規模應用,大家首先想到的是人臉識别,其實Re-ID作為新興研究方向在最近幾年受到的關注程度是非常高的。千視通發現,目前人臉識别技術在安防行業落地較多,的确是發展所向,但在很多實際場景中,人臉識别技術作用并不突出。

受限于視頻監控探頭的安裝高度及密度,在實際運行過程中,它們更多拍到的是行人的頭頂、後腦勺或者側臉。其次,即便拍到人臉,攝像頭拍攝的像素可能不高,尤其是遠景攝像頭裡面人臉截出來很可能都沒有32x32的像素。所以人臉識别在實際的重識别應用中很可能有限,無法看清。

于是,千視通基于多年實戰經驗,提出一種卡視聯動技戰法,結合人臉識别和跨鏡追蹤(Re-ID)各自的特點及優勢,以少量的人臉卡口加大量的普通監控探頭的部署,既可鎖定嫌疑人身份,又能重現嫌疑人軌迹,這種創新的綜合型技戰法可以較大概率對監控範圍進行覆蓋,具有極強的實戰價值,對安防行業具有颠覆性意義。

讓AI算法落地,不斷尋找業務場景

技術發展永遠都是一條向上的道路,對于Re-ID技術的精進上,千視通不斷投入大量資源進行相關技術研究、攻克。但無論是數據排名如何刷新、趕超世界水準,都繞不開一個最重要的議題:讓AI算法落地。作為國内第一家發布視頻搜索産品的

計算機視覺科技公司,千視通七年裡一直在最前線深耕,在業務場景裡發現行業痛點并不斷打磨算法和産品,獲得了300+客戶單位的認可。

千視通相信,AI技術的發展要與場景應用密切結合,用最好的服務去發揮AI算法的價值,推動各行各業邁入更高效的時代去賦能。随着場景愈加豐富與成熟,千視通的技術也在迅速往前超。

由一項技術的突破,衍生到規模化的運作,為一個行業帶來更極緻的降本增效,人工智能,讓城市更加安全、便捷、智慧,是千視通一直秉承的偉大使命!