AI SQL Limited (ASX:APX) 實現安全的最先進的人工智能輔助數據標注 平臺通用人工智能 (AGI) Realize the most advanced AI-assisted data labeling platform Artificial General Intelligence (AGI) AI AQL 2023 數據集的通用性 隨著人工智能( AI )技術的快速發 展, AI 數據的需求與日俱增。 AI 的數據化全球市場正呈現出蓬勃 的增長態勢。在這個市場中,一個 重要的現象是 AI 數據的重複度高。 With the rapid development of artificial intelligence (AI) technology, the demand for AI data is increasing day by day. The global market for AI digitization is showing a booming growth trend. In this market, an important phenomenon is the high degree of repetition of AI data. AI 在多個領域都有廣泛的應用,例如電腦視覺、自然語言處理、語音識 別等。不同領域的 AI 模型往往需要相似或重疊的數據集來進行訓練,導 致數據的重複使用。 某些數據集在不同的應用場景中具有通用性。例如,圖像識別中的一些基礎 數據集(如 ImageNet )被廣泛應用於各種電腦視覺任務中,包括物體檢測、 圖像分類等。這導致了數據集的重複使用和共用。 為了促進 AI 模型的比較和基準測試,一些數據集已經成為行業 標準。這些數據集經過廣泛驗證和標注,被廣泛用於學術研究 和商業應用中,從而導致數據的重複度較高。 什麼是 訓練數據? 為什麼訓練數據很重要? 訓練數據是指用於訓練 AI 模型或機器學習演算法, 使其做出正確判斷的已標注數據。 舉例來說,如果您想要為自動駕駛汽車建立模型,則訓練數據將會包含已標記的圖像和 視頻,用以識別汽車、街道標誌和人群。如果您要創建一個客服聊天機器人,則訓練數 據的文本和音頻可能會以各種不同的方式詢問 “ 我的帳戶餘額是多少? ” ,然後將其翻 譯成不同的語言。 訓練數據對於任何 AI 模型或專案的成功而言都至關重要。我們試想 “ garbage in, garbage out ” 這個道理:如果您用品質差的數據訓練模型,那麼如何期望模型能夠表 現完美?肯定不會,也永遠不會。 您可能擁有最合適的演算法,但是如果使用不恰當的數據對機器進行訓練,那麼機器就 會被錯誤引導、也就無法達到預期,也無法按您(或客戶)的期望運行。因此,成功與 否幾乎完全取決於您的數據品質。 AI SQL Limited — 值得信賴的人工智能 生命週期數據合作夥伴 AI SQL Limited - A Trusted AI Lifecycle Data Partner • AI SQL 是 AI 生命週期數據的全球領導者。 • 憑藉在數據獲取、數據標注和模型評估方面超過 5 年的經驗,我們使組 織能夠推出世界上最具創新性的人工智能系統。 • 我們的專業知識包括遍佈全球 170 個國家 / 地區的 70,000 多個地點的超 過 1 , 00 0,000 名精通 235 種語言的眾包資源,以及業界最先進的人工智 能輔助數據標注平臺。我們的產品和服務讓技術、汽車、金融服務、零 售和醫療保健領域的領導者有信心啟動世界級的 AI 專案。 潛心調研 — 為 AI 生命週期提供高質量數據 Dedicated Research - Delivering Quality Data for the AI Lifecycle 經過我們的調研, 80% 的 AI 專案時間與精力被用於管理數據。 AI SQL 支持數據獲取、數據標注和真實世界的模型評估需求,使您能夠 集中於您的首要任務,自信地啟動專案。 6 “ ” 資質 證書 Qualifications TECHNOLOGY QUINTESSENTIALS LTD. https://find-and-update.company- information.service.gov.uk/company/09407213 ● AI SQL 專案組由 TECHNOLOGY QUINTESSENTIALS LTD. 公 司聯合 Microsoft 基金會共同出資打造,旨在加快全球 AI 的 構建確保數據的安全性以及隱私合規性,在北美區負責人 Arvid Jensen 博士的支持下, Jovan Petrovic 等人基於當 前全球 AI 數據緊缺, AI 模型受限於數據處理能力不足等局 面,創造了 AI SQL 。 ● AI SQL 是專注於為 AI 公司提供數據支撐。我們致力於為 AI 專案和機器學習模型訓練提供高質量、經過標注的訓練數 據集 。 AI SQL 專案團隊 AI SQL project team AI SQL 技术团队介紹 AI SQL project team Arvid Jensen 研发工程师 麻省理工學院電腦科學碩士,曾在麻省理工學院電腦實驗室 工作,參與了多個創新專案的開發和實施。 他致力於將公司 打造成為全球領先的雲計算服務提供商,並向人工智能領域 拓展。 Jovan Petrovic 数据引擎 专家 畢業於加拿大滑鐵盧大學電腦專業,積累了超過 20 年的技術 相關工作經驗。加入穀歌,擔任軟體開發工程師,負責穀歌 演算法的開發和優化。期間,帶領團隊成功研發出基於人工 智能的新產品,成為公司主打產品之一。後加入 AI SQL ,負 責技術創新和專案研發。 Niklaus Mueller 数据 处理 专家 畢業於美國普林斯頓大學, SolaDigit 基金會財務投資人。 Dubois 擁有一流的企業管理和領導經驗, 他在全球擁有廣泛的 業務網路和人脈。 曾任職於 NVIDIA ,在人工智能、遊戲、自動 駕駛、數據中心等重要領域擔任部門管理職務。 Leif Eriksson 人工智能顧問 曾在一家全球領先的 AI 研發公司擔任高級研究員,專注於深度學 習和機器學習演算法的開發,他的研究成果廣泛應用於 AI SQL 的 優化中。 Dr. SAIto 在人工智能領域有深厚的研究和實踐經驗,他 的加入為 AI SQL 帶來了新的視角和技術手段。 Service AI SQL 核心服務 AI SQL Core Services 數據標注與注釋: 我們提供準確和可靠的數據標注和 注釋服務,為 AI 公司提供高質量的 訓練數據。無論是圖像識別、自然 語言處理、語音識別還是其他領域, 我們可以滿足您的需求。 數據清洗與預處理: 我們瞭解數據清洗和預處理對於模 型訓練的重要性。我們通過數據清 洗、去噪和數據預處理等步驟,確 保數據的品質和準確性,使其符合 您的訓練目標。 數據定制化服務: 我們理解每個 AI 專案的獨特性和需 求。因此,我們提供定制化的數據 服務,根據您的具體要求和應用場 景,為您提供符合需求的訓練數據。 數據獲取 業務流程 Business Process AI SQL 為來自我們全球超過 1 , 00 0,000 眾包的一系列環境 ( 工作室、家庭、辦公室、車內、公共場所 )提供跨各種 數據類型( 語音、文本、圖像、視頻、混合 )的數據收集 服務。眾包團隊為您可能擁有的任何用例提供授權數據集, 並通過我們的端到端託管服務完成專案。我們還為所有組 織提供數據採購解決方案。 01 數據處理 02 我們行業領先的平臺和機器學習輔助工具可提供標注、判 斷和打標服務,為您的模型創建高質量的標籤數據。我們 還提供行業領先的知識圖譜和本體支持服務,幫助您將數 據智能化。 04 模型開發合作夥伴 我們提供針對不同用例和人口統計數據的真實模型性能驗 證和調整。通過引入動態元素,我們可以提供更逼真的真 實世界設置來測試您的 AI 系統,從而使測試環境更接近真 實世界的部署環境。借助行業基準,我們可以將模型性能 與競爭對手進行比較,以確保您能夠獲得一流的結果。 03 為 AI 的生命週期提供數據是我們的專長,在模型訓練和部 署方面,我們選擇與雲計算領域的行業專家合作。我們的 合作夥伴是領先的技術和服務公司,您可以利用它們來構 建端到端的 AI 解決方案。無論是您的內部工程師和數據科 學家團隊,還是您選擇與我們的戰略技術合作夥伴合作, 我們都會為您的團隊提供數據來訓練和部署 AI 模型。 ...... 1,000,000+ 全球眾包資源 170+ 國家 / 地區 235+ 語言和方言 AI SQL 數據採集業務 AI SQL Data Acquisition Service 我們提供多種眾包人員服務,進行遠程的線上數據服務, 保證您的需求可以得到安全性保障。 目前主要通過生活必備的 娛樂要素 ( 影視為切入口 ) 、遊 戲、音樂、體育、 等入口同步架設,用全球 70 億人口都 離不開的娛樂要素以及移動娛樂,來做我們計畫的第一 步 AI 數據採集服務 基於 20 多年累積的專業知識的人工智能訓練數據採集服務及 全球覆蓋的市場 AI training data collection services based on 20+ years of accumulated expertise and markets with global coverage 數據採集服務 專案名稱 數據採集 服務類型 圖像視頻採集 圖像視頻採集 遍佈全球的採集資源,高效的採集軟體,有效的質檢工具 和流程,豐富的大型專案管理經驗,全球多國自有當地專 案團隊,符合 GDPR 合規性要求 各人種、 各場景 人臉識別,表情識別, 姿態識別,手勢識別, 目標物品檢測 每張或每段 服務優勢 詳情 常見使用案例 收費 單位 文本採集 多語言文本數據 OCR 採集 遍佈全球的眾包資源,全語種對應,採集到轉寫全流程服務能力 支持 180 種語言。阿拉伯語、他加祿語、 越南語、泰語、印尼語、土耳其語、法 語、北印度語、德語、西班牙語、日語、 波蘭語等。 OCR 識別 每框 多語言語料拓展 全語種對應,遍佈全球的海量眾包資源,資深語言學專家 支持 180 種語言。阿拉伯語、他加祿語、 越南語、泰語、印尼語、土耳其語、法 語、北印度語、德語、西班牙語、日語、 波蘭語等。 語音助手意圖識別 每句 多語言實體詞採 集 全語種對應,遍佈全球的海量眾包資源,資深語言學專家, 強大的技術團隊 支持 180 種語言。阿拉伯語、他加祿語、 越南語、泰語、印尼語、土耳其語、法 語、北印度語、德語、西班牙語、日語、 波蘭語等。 語音助手意圖識別 每句 語音採集 TTS 語音合成及 製作 遍佈全球的優質聲優資源,聲優資源平臺定制 TTS 語音合成服務 資深語言學專家團隊,富的 TTS 語音合成經驗 男女聲、童聲、普通話、方言、各 種外語 人工智能產品語音助 手,有聲讀物,智能 客服 每字或 每小時 方言採集 豐富的專案管理經驗,嚴格的品質把控流程,海量的錄音資源, 採集到轉寫端對端全流程服務能力 上海話、蘇州話、無錫話、武漢話、 山東話、粵語、天津話、四川話、 南京話 語音識別,聲紋識別 每小時 ASR 採集 遍佈全球的海量錄音資源,高效的錄音平臺工具,有效的 質檢工具和流程,豐富的大型專案管理經驗,符合 GDPR 合規性要求 支持 180 種語言。阿拉伯語、他加祿語、越 南語、泰語、印尼語、土耳其語、法語、北 印度語、德語、西班牙語、日語、波蘭語等。 語音識別,聲紋識別 每小時 AI SQL 數據採集 AI SQL Data Acquisition 多元化、包容性的文化對於我們幫助您構建更好的 AI 的使命至關重要。我們為世界各 國具有各種能力和背景的個人提供機會,確保向我們的客戶提供公正、符合道德標準 的數據。 • 多樣性 我們的目標是在我們運營的全球每個市場向我們的人群支付高於最低工資的工資,同 時促進眾包團隊的健康、社區和聯繫。 • 社會責任 我們為客戶數據和 PII 提供安全的環境,採集的資訊均只為滿足客戶專案需求。我們 會採取預防措施來保護這些數據,並且不會在未經同意的情況下將個人的私人數據透 露給第三方。 • 安全性 AI SQL 數據標注 AI SQL data annotation 我們支持各種電腦視覺工具,包括對象 跟蹤、像素級語義分割和圖像轉錄。所 有這些工具都支持自帶模型假設,以實 現更快的標注和更好的模型驗證。 圖像和視頻的標注和轉錄 我們提供大規模的文本分類和 NLP 標注, 包括命名實體識別和語音標注。所有這些 工具都支持自帶模型假設,以實現更快的 標注和更好的模型驗證。我們還能為機器 學習專案提供電腦輔助翻譯。 文本標注與翻譯 我們提供了一個可擴展的音頻數據管道, 包括收集、分割、事件標注和轉錄。所 有這些工具都支持自帶模型假設,以實 現更快的標注和更好的模型驗證。 音頻標注與轉錄 我們支持廣泛的音頻、網站、文本和圖像 數據採集管道。支持的用例包括為 ASR 和 文本類的對話代理創建訓練數據。我們可 以看到的任何數據都可以添加元數據或其 他資訊。我們使用 ML 模型來驗證人工所 提交輸入的品質,進而快速完成大規模數 據採集專案。 數據採集和擴充 無論是進行情緒分析、內容審核還是搜 索相關性調整,我們都能夠提供超大規 模的數據分類管道,可滿足您的任何數 據分類需求。專有的品質控制技術可以 輕鬆幫助您實現 95% 以上的精度和精確 度。 數據分類 我們的點雲標注工具能夠為無人駕駛 汽車、製造及農業等行業提供長方體 標注。機器輔助標注工具能夠快速、 準確地完成大規模標注。 點雲標注 借助我們可靠的訓練數據 自信地部署世界級 AI Confidently deploy world-class AI with our reliable training data 受到全球領導者的信任,為人工智能提供動力 Trusted by global leaders to power artificial intelligence 2021 Awarded to forward- thinking data companies The Nimdzi 100 Top 10 ranked as the 7th largest Language Service Provider (LSP) in the market. 2021 The Big Innovation Award was awarded for TICO-19, a partnership with Translators without Borders to translate COVID-19 terminology into 37 languages. 2021 Ranked #8 among the world's largest language service providers in Common Sense Advisory's (CSA Research) "Who's Who in Language Services and Technology: 20 20 Ranking" 2020 2020 Included in the Deloitte Asia Pacific High-Tech Fast 500 list for three times Guard and Reserve Employers Support U.S. Department of Defense Program Fostering Collaboration Between Civilian Employers and Their National Guard and Reserve Employees 2020 2020 Named to FlexJobs' Top 100 Most Remote Work- Focused Companies 2020 – No. 1