|
|
| |
| |
职位描述 用小程序查看更多 |
|
岗位职责: 1.视频数据收集:设计并搭建多源异构视频数据的收集管道,包括但不限于现场采集、网络爬虫策略设计、API对接、合作方数据导入等,对收集的数据进行初步筛选和评估,制定数据收集标准和流程,确保收集的数据符合视频大模型训练需求。 2.数据清洗:开发和优化视频数据清洗算法和自动化脚本,处理视频数据中的噪声,如黑帧、模糊、抖动等问题。 3.数据增强:设计并实施多样化的视频数据增强策略,包括但不限于裁剪、旋转、色彩调整、帧率变化等基础操作,以扩充数据集规模和多样性。根据不同的视频大模型训练任务需求,定制化开发数据增强方案,提高模型的泛化能力和性能。 4.文档编写与知识沉淀:编写详细的数据处理流程文档、技术手册和数据字典,确保团队成员能够理解和使用数据集。沉淀数据处理最佳实践和经验,参与制定数据处理相关的技术规范和标准。与团队成员分享技术知识和经验,推动团队技术能力的提升。
任职要求: 1、本科及以上学历,计算机科学、人工智能、数据科学、数学等相关专业。具有1年以上数据处理经验,有图像生成或视频生成大模型等领域的数据处理经验者优先。 2、熟练掌握Python,熟悉爬虫技术,具备扎实的数据 |
|
| |
|
|
| |
|