摘要:美團作為全球最大的本地生活服務平臺,擁有由遍布全國的市場人員所拍攝的眾多門臉招牌圖片數據。中文在實際應用場景的表現并不樂觀。美團今年聯合國內外知名科研機構和學者,提出了中文門臉招牌文字識別比賽。是難得的用于研發和評估中文識別技術的數據集。
美團作為全球最大的本地生活服務平臺,擁有由遍布全國的市場人員所拍攝的眾多門臉招牌圖片數據。每張圖片都是由全國的不同個人,采用不同設備,在不同地點,不同時間和不同環境下所拍攝的不同目標,是難得的可以公正評價算法魯棒性和識別效果的圖片數據,挑戰也非常大。
近年來業界圍繞著文字檢測和文字識別提出了許多有效的算法和技術方案。由于之前公開的數據集普遍以英文為主,因此所提出的技術方案對中文特有問題關注不足。表現在以中文為主的實際應用場景中,這些技術方案的結果與應用預期差距較大。以美團掌握的某典型中文圖片數據為例,在6000張圖的圖片數據集上(已去除文字無法辨識的圖片),測試了國內最知名的三個AI開放平臺,按字段統計識別率分別是94%,91% 和 86%,經過努力我們也只達到 98%。中文OCR在實際應用場景的表現并不樂觀。
在此次 ICDAR2019上,我們挑選出很能代表中文特點的餐飲商家的門臉招牌圖片來組織競賽,這些招牌上的文字存在中文特有的設計和排版,同時也兼有自然場景文字識別中普遍存在的拍照角度、光照變化等干擾因素。我們希望通過競賽引起同行們對中文識別的關注,群策群力解決中文識別的實際問題。
會議與大賽介紹國際文檔分析與識別國際會議 (International Conference on Document Analysis and Recognition,ICDAR)是由國際模式識別學會(IAPR)組織的專業會議之一,專注于文本領域的識別與應用。ICDAR大會每兩年舉辦一次,目前已發展成文字識別領域的旗艦學術會議。為了提高自然場景的文本檢測和識別水平,國際文檔分析和識別會議(ICDAR)于2003年設立了魯棒文本閱讀競賽(“Robust Reading Competitions”)。至今已有來自89個國家的3500多支隊伍參與。
ICDAR 2019將于今年9月20-25日在澳大利亞悉尼舉辦。 美團今年聯合國內外知名科研機構和學者,提出了"中文門臉招牌文字識別"比賽(ICDAR 2019 Robust Reading Challenge on Reading Chinese Text on Signboards)。
組織者王棟、張睿、劉曦、周永生,美團
白翔、廖明輝、楊明錕,華中科技大學
Baoguang Shi, Microsoft (Redmond,USA)
Shijian Lu, Nanyang Technological University (Singapore)
Dimosthenis Karatzas,Computer Vision Centre,UAB(Spain)
C. V. Jawahar,IIIT Hyderabad(India)
數據集介紹美團本次公開的數據,由遍布全國的市場人員所拍攝的眾多門臉招牌圖片組成,共25000張。每張圖片是由完全獨立的不同個人,采用不同設備,在不同地點,不同時間和不同環境下所拍攝的不同商家。該數據集以中文文字為主,也包含一定數量的英文和數字,英文和數字的占比介于 10% 和 30% 之間。標注內容比較完備,每張圖片均標注了單個字符的位置和文本,以及各字符串的位置和文本。是難得的用于研發和評估中文識別技術的數據集。其中,20000張圖片用于訓練,2000張用于驗證,3000張用于測試。
比賽內容本次門臉招牌識別,共定義了 4 個任務,分別如下:
TASK 1:招牌端到端文字識別
TASK 2:招牌文字行定位
TASK 3:招牌區域內單字識別
TASK 4:招牌區域內字符串識別
獎勵方式頒發獎狀:按照最終成績進行排名,以從高至低順序依次選取前三名,頒發獎狀。
比賽獎金:從高至低順序選取前三名參賽方為學校及科研院所等非盈利機構。
獎金詳細如下:
2019年3月1日:報名通道開放
2019年3月18日:訓練數據集開放
2019年4月15日:測試數據集分批開放
2019年4月16日:提交通道開放
2019年4月30日:提交截止日期
2019年5月10日:比賽最終報告提交
2019年9月20日:ICDAR 2019 大會召開
參賽報名掃描下方二維碼,直接進入報名鏈接報名。
報名鏈接地址: http://rrc.cvc.uab.es/?ch=12
報名鏈接二維碼:
參賽答疑郵箱:mtdptech@meituan.com(郵件標題請注明 “ICDAR2019”)
加入參賽交流微信群
步驟1:微信添加 “MTDPtech02” 為好友(昵稱:美美),或掃描下方二維碼直接添加:
步驟2:回復美美 “ICDAR2019”,則會自動將您加入ICDAR2019-ReCTS技術交流群
文章版權歸作者所有,未經允許請勿轉載,若此文章存在違規行為,您可以聯系管理員刪除。
轉載請注明本文地址:http://m.specialneedsforspecialkids.com/yun/17937.html
摘要:月日,各項競賽的排名將決定最終的成績排名。選手通過訓練模型,對虛擬股票走勢進行預測。冠軍將獲得萬元人民幣的獎勵。 showImg(https://segmentfault.com/img/bVUzA7?w=477&h=317); 2017年9月4日,AI challenger全球AI挑戰賽正式開賽,來自世界各地的AI高手,將展開為期三個多月的比拼,獲勝團隊將分享總額超過200萬人民幣的...
摘要:基于深度學習的語義匹配語義匹配技術,在信息檢索搜索引擎中有著重要的地位,在結果召回精準排序等環節發揮著重要作用。在美團點評業務中主要起著兩方面作用。 寫在前面美團點評這兩年在深度學習方面進行了一些探索,其中在自然語言處理領域,我們將深度學習技術應用于文本分析、語義匹配、搜索引擎的排序模型等;在計算機視覺領域,我們將其應用于文字識別、目標檢測、圖像分類、圖像質量排序等。下面我們就以語義匹配、圖...
閱讀 3332·2021-11-25 09:43
閱讀 3017·2021-10-15 09:43
閱讀 1974·2021-09-08 09:36
閱讀 2928·2019-08-30 15:56
閱讀 750·2019-08-30 15:54
閱讀 2694·2019-08-30 15:54
閱讀 2984·2019-08-30 11:26
閱讀 1255·2019-08-29 17:27