當前位置:钱柜娱乐手机版 » 北京 » [北京]字節跳動

[北京]字節跳動

  1. 發布時間:2019-10-14
  2. 工作地點:北京
  3. 職位類型:兼職實習
  4. 來源:北大BBS
  5. 職位:搜索算法實習生|數據挖掘實習生|搜索架構實習生|數據抓取實習生
專業標簽:計算機

招聘崗位包括:搜索算法實習生、數據挖掘實習生、搜索架構實習生、數據抓取實習生

郵箱發至liubowen.daniel@bytedance.com

搜索算法實習生 

職位描述: 

1、參與ByteDance搜索引擎研發工作,用最前沿的機器學習算法、海量的數據,做最激動人心的技術、給用戶最好的搜索體驗;

2、參與今日頭條/抖音/TikTok等核心產品的搜索研發工作,服務數億全球用戶;

3、參與搜索核心算法改進,可能的方向包括:

  (1)NLP:將業界最先進的NLP技術應用到搜索算法改進中,包括糾錯、分詞、改寫、Term Weighting、意圖識別;

  (2)Ranking:千億級網頁的排序問題,攻克基礎檢索、相關性、意圖理解、權威性、時效性等世界難題;

  (3)頁麵分析和摘要:從千億網頁中提取最有價值的信息,進行結構化字段提取、智能摘要生成、轉碼等工作來優化搜索體驗;

  (4)鏈接分析:從萬億鏈接中找出最有價值的網頁,優化鏈接質量、索引質量、垃圾作弊識別、調度策略等。

職位要求: 

1、出色的分析問題、問題能力,紮實的代碼能力、數據結構和基礎算法功底;

2、有機器學習、NLP和數據挖掘基礎和開發經驗者優先;

3、熟悉Llinux開發環境,熟練使用C 和Python語言;

4、如果你絕頂聰明,總是能7天深入一個全新的領域成為專家,則可以忽略以上所有要求;

5、2020年及以後畢業,實習時間不少於4個月,每周不少於4天;钱柜娱乐手机版官网希望能有充足的時間培養你,也希望你能充分參與業務做出卓越的貢獻。

數據挖掘實習生 

職位描述: 

1、負責搜索Spider係統的基礎數據挖掘和核心技術研發

2、負責互聯網資源特征數據挖掘,包括頁麵特征、站點特征、頁麵價值度、熱點變化趨勢等

3、負責鏈接的反垃圾,識別無價值鏈接,控製鏈接規模

4、利用機器學習/深度學習算法建立模型,預估鏈接質量

職位要求: 

1、計算機或相關專業,本科及以上學曆,2020年及以後畢業

2、優秀的編碼與代碼控製能力, 有紮實的數據結構和算法功底 

3、精通C/C 語言編程,熟悉linux平台、shell編程

4、每周實習至少3天,可以連續實習3個月以上

搜索架構研發實習生 

職位描述: 

1、參與ByteDance搜索引擎研發工作,用最前沿的機器學習算法、海量的數據,做最激動人心的技術、給用戶最好的搜索體驗;

2、參與頭條/抖音/TikTok等核心產品的搜索研發工作,服務數億全球用戶;

3、參與搜索核心架構改進,可能的方向包括:

  (1)設計開發千億級網頁搜索的數據流、分布式建庫、在線檢索係統,設計業內領先的檢索架構;

  (2)設計開發萬億級Spider係統的實時計算、調度分發、壓力控製、蜘蛛抓取等服務;

  (3)設計開發高可用的搜索引擎穩定性、自動測試和運維平台;

4、在這裏你可以毫無曆史包袱地實現自己的架構夢想。

職位要求: 

1、出色的分析問題、問題能力;

2、出色的代碼能力,出色的數據結構和基礎算法功底;

3、有分布式係統基礎和開發經驗者優先;

4、精通linux開發環境、C 語言、網絡和多線程編程;

5、如果你絕頂聰明,總是能7天深入一個全新的領域成為專家,則可以忽略以上所有要求;

6、2020年及以後畢業,實習時間不少於4個月,每周不少於4天;钱柜娱乐手机版官网希望能有充足的時間培養你,也希望你能充分參與業務做出卓越的貢獻。

數據抓取實習生 

職位描述: 

1、負責搜索Spider係統的架構設計和核心模塊開發;

2、負責搜索Spider分布式計算、調度、抓取、壓力控製等模塊的設計開發;

3、負責蜘蛛程序的開發優化,基於webkit內核的js渲染引擎;

4、負責網頁特征抽取,利用模版或自動化抽取網頁特征;

5、負責搜索Spider數據可視化,日常數據分析和監控。

職位要求: 

1、計算機或相關專業,本科及以上學曆,2020年及以後畢業;

2、優秀的編碼與代碼控製能力, 有紮實的數據結構和算法功底 ;

3、精通C/C 語言編程,熟悉linux平台、shell編程;

4、每周實習至少3天,可以連續實習3個月以上。

上一條:沒有了 下一條: [北京]海高教育
©前錦網絡信息技術(上海) 版權所有
網站備案/許可證號:滬ICP備12015550號-13 | 上海市公安局徐匯分局網監中心備案編號:3101040220 | 觸屏版