国产xxxx99真实实拍_久久不雅视频_高清韩国a级特黄毛片_嗯老师别我我受不了了小说

資訊專欄INFORMATION COLUMN

如何運營一家數據標注公司 (市場結構篇)

rozbo / 1200人閱讀

摘要:眾包公司聯系到需求數據標注的客戶,和客戶建立合作關系后,將客戶需求傳達給合作的大眾志愿者,從而形成一個需求公司數據標注眾包公司多個大眾志愿者這樣一個眾包結構。數據保密困難目前國內的公司,實驗室還沒有形成井噴之勢。

隨著AI浪潮的斬頭露角,數據標注行業也猶如雨后春筍般蓬勃的發展起來。

本文就目前國內數據標注行業存在的幾個階段性結構特征進行展開,讓更多想了解數據標注的AI公司、AI實驗室、準備加入數據標注的朋友們,快速熟悉目前數據標注行業的現狀和運營數據標注公司應該注意的若干問題。
數據標注市場目前有下面幾種結構:
一、 眾包結構
顧名思義,就是把需要完成的任務分發給大眾志愿者(也就是市場上說的兼職)。這其中就出現了眾包公司。眾包公司聯系到需求數據標注的客戶,和客戶建立合作關系后,將客戶需求傳達給合作的大眾志愿者,從而形成一個“需求公司——數據標注眾包公司——多個大眾志愿者”這樣一個眾包結構。

這種眾包結構的優點就是可以組織起社會上的大眾志愿者進行數據標注,而大眾志愿者不用占用太多的公司資源,勞動力成本相對較低。對于數據標注眾包公司費用支出的核心——人工來說,無疑是可以極大的減少公司的運營成本,從而使公司自身在面對需求數據標注的客戶時的報價更具有競爭力。
當然,眾包結構的缺點和優點一樣顯而易見,甚至可以說它的缺點已經慢慢的大過了它的優點,為什么這么說呢?

1. 需要擁有大量的志愿者基數
由于上游客戶的需求可能千變萬化,同時客戶的需求很大概率都是階段性的,這就要求眾包公司合作的大眾志愿者首先自身得是穩定的。但是由于大眾志愿者就是利用閑散時間進行工作的這種特性,長期穩定的大眾志愿者幾乎不太可能,這就要求數據標注眾包公司必須擁有龐大的大眾志愿者團隊,形成一個體系。才能保證在發放任務的時候總是有充足的大眾志愿者進行合作。
2. 溝通成本高昂
而當大眾志愿者的數量能夠滿足任務要求時,我們又不得不面對另一個事實:數據標注眾包公司在與需求公司洽談合作時只能有針對性的進行數據標注類型的選擇。如果在選擇數據標注項目上普遍撒網,就會面對公司自身需要投入巨大的精力去培訓那些不斷更迭的大眾志愿者。而很多時候公司在大眾志愿者合作方面節約下來的成本,其實已經全部轉嫁到了公司培訓、糾錯諸如此類的溝通環節。
3. 數據保密困難
目前國內的AI公司,AI實驗室還沒有形成井噴之勢。但就現階段而言依然有眾多AI公司,AI實驗室在進行著高度重疊的產品研發。對于有標注需求的公司來說,如果被標注數據都是真金白銀獲取來的,那么倘若在眾包環節眾包公司處理不當,很有可能AI公司辛苦獲取的數據就成了其他AI公司的嫁衣。
4. 無法給予需求公司靈活的服務
因為大眾志愿者擁有流動性的特點,一旦需求公司改變原有標注需求,數據標注眾包公司是沒有辦法在較短的時間進行調整的。同時,數據標注眾包公司的客戶群體也相對單一,由于大眾志愿者的群體特點,數據標注眾包公司只能把更多精力放在需要大批量數據標注,同時標注規則相對簡單的需求公司。但是AI的訓練是一個階段性的過程,基本上都是:小批量找特征訓練——較小批量簡單場景訓練——較小批量復雜場景訓練——大批量訓練。在數據標注眾包公司砍掉處在第一階段的AI公司和AI實驗室的時候,其實也就是砍掉了相當一部分潛在客戶。
二、 工廠結構
有了眾包結構里的兼職架構,下面就著重介紹一下全職架構,也就是工廠結構。
工廠結構相較于眾包結構形式上要簡單一些,省去了中間眾包商這個環節,進而形成了一個“需求公司——數據工廠”這樣的工廠結構。

相較于數據眾包公司,數據工廠的優點就是標注人員穩定,能做到需求方和數據標注方即時溝通,溝通成本大大降低。同時,由于數據是以一對一的形式進行傳遞的,也大大降低了數據被泄露的可能性。
雖然工廠結構可以有效的規避很多眾包結構中存在的種種問題,但是依舊有很多問題他是沒辦法解決的,那我們就看看有哪些問題工廠結構解決不了呢?
1. 選擇標注公司的困難
在市場上可能有成百上千個工廠結構的數據標注公司,但是有數據標注需求的公司應該如何選擇呢?如果沒有選擇正確的標注公司,不僅得不到高質量的標注數據,更有可能因為數據大批量不合格而重復返工,進而耽誤了原本項目的工期。而在這個AI公司百家爭鳴的時代,時間才是最重要的,誰的產品最先出世,也就最有機會獲得資本的垂青。但是有標注需求的公司如何在眾生百態的標注市場中選擇一個質量和效率雙重過硬的公司其實是一件非常困難的事情。
2. 工廠結構公司兩極分化
因為各種各樣的原因,工廠結構的公司兩極化很明顯:較大的可以達到上千人;而較小的,只有幾個人。因為兩級分化的原因,市場現在就會出現一個很有意思的現象:大的公司很少會去對接短期且數據量較少的項目,因為承接較少的數據量對于一個較大的工廠結構的標注公司來說很有可能都不夠公司日常的管理運營成本;反之,小的標注公司可以承接短期數據量較少的項目,但是在大批量數據殺到的時候,又會顯得捉襟見肘,難以承接。
3. 人工成本風險較高
首先因為是全職,不論有沒有任務,都涉及一個員工薪酬的發放。其次,需求方公司的需求有大概率是呈周期性的,就是有可能這周公司有項目做,下周可能就沒有了。這就會映射出一個工廠結構的數據標注公司非常尷尬的處境:合同期限內需要完成的大項目可能需要大量人員進行參與。可是一旦合同結束了,公司卻又沒有找到后續能夠進行人員分配的項目,這就會給數據標注公司的運營帶來挑戰。

三、 眾包+工廠結構
有了眾包和工廠結構的總結,我們不難發現,他們各有各的優點,也各有各的缺點。這里提出的眾包+工廠結構,其實就是將兩者進行了優缺點的融合,揚長避短。
那么大家肯定會有疑問,怎么融合呢?如何才能將這兩種結構很好的在實際操作中統一起來呢,歡迎大家持續關注,在后面的篇幅里,會有詳細介紹。

閱讀原文請進入:http://www.awkvector.com/

文章版權歸作者所有,未經允許請勿轉載,若此文章存在違規行為,您可以聯系管理員刪除。

轉載請注明本文地址:http://m.specialneedsforspecialkids.com/yun/19855.html

相關文章

  • 如何運營一家數據標注公司 (資源特點

    摘要:那么問題來了,人工智能公司人工智能企業人工智能研究所多種多樣,作為一個數據標注公司應該如何定義自己的服務方向呢首先我們要能夠準確的了解資源公司的特點,這樣才能更好的為其提供符合自身特點的服務。 在基礎架構篇中我們提到的資源,也就是數據標注公司要面對的甲方:AI公司、AI企業、AI研究所。那么問題來了,人工智能公司、人工智能企業、人工智能研究所多種多樣,作為一個數據標注公司應該如何定義自...

    Tony 評論0 收藏0
  • 如何運營一家數據標注公司 (基礎架構

    摘要:數據標注行業,一個因為人工智能崛起而新興的行業。那么問題來了,如何運營一家標注公司呢本文先從最基礎的標注公司架構開始介紹,不同階段的標注公司的運營是有差別的,可以通過接下來不斷更新的文章中獲取跟多的信息。 數據標注行業,一個因為人工智能崛起而新興的行業。 大多數AI實驗室、初創型AI公司在發展初期如果雇傭大量的人力進行數據標注,就不得不面臨下面兩種處境:首先對公司的管理方面就是巨大的挑...

    vvpale 評論0 收藏0
  • 聽說你想來做人工智能了

    摘要:達觀數據招人啦面向北京上海深圳成都四個地區提供人工智能算法產品銷售等多類崗位畢業多年,你的狀態還好嗎是否憂慮被甩在時代的邊緣是否擔心被機器取代是否不安現狀躍躍欲試來吧,選擇對的行業,與優秀的人一起共事,與我們一起走在時代的風口上,從事當下最 showImg(https://segmentfault.com/img/bVbeHrX?w=720&h=400);達觀數據招人啦! 面向北京、上...

    zzir 評論0 收藏0
  • 一文徹底讀懂 Tether,究竟是神、是妖、還是魔?

    摘要:是全球最大的加密貨幣交易所之一,一些市場觀察人士稱,在交易的代幣有助于支撐比特幣的價格。報告稱,在年月日的審計時點上,一家銀行以名義開具的賬戶下擁有美元的款項。截至年月底,波多黎各這類金融機構的現金與總資產的比率迅速攀升至以上。 在追求各種類型「共識」的數字貨幣世界里,對 Tether 的看法顯然很難達成共識,極具爭議,也引人矚目。 在尋找穩定代幣的投資者眼中,Tether 如神,是解...

    zhaot 評論0 收藏0
  • CNCF里程碑:超過375家會員

    摘要:跨越大關是基金會的一個不可思議的里程碑,特別是在我們的最終用戶社區中有超過家組織。提供日本長期運行的首要解決方案,這是移動商務安全部署的關鍵推動因素。 基金會達到會員里程碑,包括Booz Allen、愛立信和SimpleNexus在內的59家組織加入支持 showImg(https://segmentfault.com/img/bVbpJJq); 加利福尼亞半月灣 - 2019年3月1...

    CntChen 評論0 收藏0

發表評論

0條評論

最新活動
閱讀需要支付1元查看
<