職位描述
美團平臺為用戶的基礎產(chǎn)品體驗負責,還承擔了美團的用戶增長、市場和品牌營銷、前端技術基礎設施建設以及多條業(yè)務線的產(chǎn)品設計職責,建立了融合文字、圖片、視頻和直播等不同形式的內容生態(tài)系統(tǒng),同時整合地圖服務部、客戶服務和體驗部、企業(yè)業(yè)務部、網(wǎng)約車業(yè)務部等部門,致力于用科技提升美團數(shù)億消費者、近千萬商家、騎手、司機和團長的服務體驗。美團平臺擁有高并發(fā)、多業(yè)務的復雜場景,為技術深度優(yōu)化提供了最佳實踐可能。這里有簡單、講邏輯、有愛的團隊,更是一塊理想的實戰(zhàn)場地,舞臺廣闊,歡迎你來盡情施展。崗位職責負責對基于服體大模型構建的通用垂類應用進行效果和質量評估;通過與產(chǎn)品研發(fā)團隊的緊密合作,制定評估標準和體系,準確分析評估效果,為應用的優(yōu)化和改進提供支持,以提升應用的性能、用戶體驗和市場競爭力應用效果與質量評估: 1)負責評估基于大語言模型構建的通用垂類應用的效果和質量,包括但不限于語言理解準確性、生成內容的合理性、邏輯連貫性、知識準確性等方面; 2)參與設計測試用例,涵蓋不同場景、用戶需求和輸入條件,以確保應用在各種情況下的穩(wěn)定性和可靠性;3)參與收集和分析用戶反饋數(shù)據(jù),結合實際使用情況,對應用的性能和用戶體驗進行綜合評估;評估標準與體系建設:1)理解業(yè)務需求和產(chǎn)品目標,與產(chǎn)品研發(fā)團隊密切溝通和協(xié)作,負責制定詳細、明確的評估標準和指標體系; 2)理解評估數(shù)據(jù)的收集、整理和分析流程,確保評估數(shù)據(jù)的完整性和可靠性,為評估體系的持續(xù)改進提供數(shù)據(jù)支持; 評估效果分析與報告:撰寫評估報告,清晰闡述評估方法、過程、結果和結論,為產(chǎn)品研發(fā)團隊提供決策依據(jù)和改進方向;崗位基本需求本科及以上學歷,有AI數(shù)據(jù)生產(chǎn)和評估相關領域背景、客服或用戶體驗背景2年以上相關工作經(jīng)驗者優(yōu)先有客戶服務和用戶體驗提升工作經(jīng)驗,包含但不限于客服、客戶銷售、客戶交付、銷售等領域中與本方向相關的經(jīng)驗,如資深客服、專家客服以及對客交付方案解決專家等;能準確理解業(yè)務訴求,對質量/數(shù)據(jù)變化敏銳,能通過獨到的視角或科學的方法發(fā)現(xiàn)并解決問題,推動業(yè)務指標達成和策略落地;有自然語言處理、搜索、人工智能領域相關工作經(jīng)驗,有AI項目交付經(jīng)驗者優(yōu)先; 有想象力、良好的理解閱讀能力和創(chuàng)意,了解國內外各種類型的AI產(chǎn)品玩法,如工具類(GPT、豆包、文心一言等)娛樂類(貓箱、星野、CAI、等)多模態(tài)AI(Midjourney、可靈等);熟悉大語言模型,有數(shù)據(jù)標注與管理的經(jīng)驗,具備從訓練數(shù)據(jù)到模型效果評估到優(yōu)化的完整經(jīng)驗者優(yōu)先;熟練使用數(shù)據(jù)分析工具,具備數(shù)據(jù)獲取、分類和分析能力;對AI產(chǎn)品有熱情與熱愛,具備出色的好奇心與學習能力,能適應較快節(jié)奏的工作方式具備以下者優(yōu)先有過數(shù)據(jù)標準標準制定、模型效果評測團隊管理者優(yōu)先有過一流互聯(lián)網(wǎng)大廠或AI大模型數(shù)據(jù)/評測交付經(jīng)驗者優(yōu)先有一定算法或技術背景,能與算法、產(chǎn)品深度密切協(xié)同者優(yōu)先崗位亮點緊跟人工智能行業(yè)的前沿進展,接觸到新的技術和行業(yè)趨勢,磨練出對人工智能的獨到見解;參與AI大模型數(shù)據(jù)生產(chǎn)到模型評測全流程,了解從理論到工程實踐的全面技能;與一流的人工智能團隊合作,快速成長,提升自身能力
企業(yè)介紹
美團是一家科技零售公司。美團以“零售+科技”的戰(zhàn)略踐行“幫大家吃得更好,生活更好”的公司使命。自2010年3月成立以來,美團持續(xù)推動服務零售和商品零售在需求側和供給側的數(shù)字化升級,和廣大合作伙伴一起努力為消費者提供品質服務。2018年9月20日,美團在港交所掛牌上市。美團始終以客戶為中心,不斷加大在新技術上的研發(fā)投入。美團會和大家一起努力,更好承擔社會責任,更多創(chuàng)造社會價值。