基本信息
文件名称:2024年火山引擎视频云实践精选集.pdf
文件大小:11.26 MB
总页数:224 页
更新时间:2025-03-16
总字数:约20.07万字
文档摘要

火山引擎视频云

实践精选集

面向体验驱动增长

随着信息革命的飞速发展,软件已深入人类生活的方方面面,深刻而彻底地改造了人类世界。秉承“全球专家、卓越智慧”的宗旨,我们特邀50+全球软件领域的技术领袖以及一线实战专家,融合主题演讲、互动研讨、案例分享、高端培训等多种形式,共同探讨软件领域的前沿发展、最佳实践和创新应用,共同打造大师智慧+实践干货的技术盛宴。

2024企业信息安全峰会大会以“直面信息安全挑战,创造最佳实践”为主题,聚焦企业信息安全技术与实践等热点话题,致力于推进企业信息安全体系建设,加强企业信息安全管理,助推企业信息安全生态圈的健康发展。

2024版

AI/大模型+音视频技术实践和前沿探索

随着信息革命的飞速发展,软件已深入人类生活的方方面面,深刻而彻底地改造了人类世界。秉承“全球专家、卓越智慧”的宗旨,我们特邀50+全球软件领域的技术领袖以及一线实战专家,融合主题演讲、互动研讨、案例分享、高端培训等多种形式,共同探讨软件领域的前沿发展、最佳实践和创新应用,共同打造大师智慧+实践干货的技术盛宴。

2024企业信息安全峰会大会以“直面信息安全挑战,创造最佳实践”为主题,聚焦企业信息安全技术与实践等热点话题,致力于推进企业信息安全体系建设,加强企业信息安全管理,助推企业信息安全生态圈的健康发展。

卷首语

FOREWORD

2024年,随着生成式AI、多模态大模型、全景直播、三维重建等技术的共同推动,它们正携

手将我们从流畅、实时、高清的数字视频世界带入更智能、更交互、更沉浸的AI视频世界。

在这个智能新视界里,用户体验也将经历全方位的变革与重构:

首先,内容生产将从UGC/PGC发展到AIGC,伴随AI视频生成模型以及智能工具的逐渐

普及,会极大降低视频生产的门槛,内容的生产量将呈几何倍数的增长;

同时,由于音视频承载了更多的信息和交互,进而演变成人类的新的“通用”语言,交互形式

从以单向信息传递为主,更迭到更丰富、更生动的音视频交流方式为主;

随着AI的深度学习和自我进化,交互模式也正在从过去的人机交互、人人交互,迈向一个人

与AI融合交互的新时代;

最后,用户的交互空间也在从2D、3D,VR拓展到了虚拟世界与现实世界的无缝融合。

随着信息革命的飞速发展,软件已深入人类生活的方方面面,深刻而彻底地改造了人类世界。秉承“全球专家、卓越智慧”的宗旨,我们特邀50+全球软件领域的技术领袖以及一线实战专家,融合主题演讲、互动研讨、案例分享、高端培训等多种形式,共同探讨软件领域的前沿发展、最佳实践和创新应用,共同打造大师智慧+实践干货的技术盛宴。

2024企业信息安全峰会大会以“直面信息安全挑战,创造最佳实践”为主题,聚焦企业信息安全技术与实践等热点话题,致力于推进企业信息安全体系建设,加强企业信息安全管理,助推企业信息安全生态圈的健康发展。

而技术从来不曾孤单,它在无尽的探索中寻找同伴,渴望得到协助,一同照亮未知的领域。

共享与进化,是它永恒的方向,每一步前行都承载着时代的梦想,引领我们共同迈向一个更加

美好的未来。

火山引擎视频云,基于抖音集团音视频技术沉淀,致力于打造“面向体验驱动增长”的视频云,

积极探索将豆包大模型和AI能力与音视频能力相结合,帮助企业端到端提升视频智能化能力,

实现体验的全面提升与业务的创新增长。

特别推出《火山引擎视频云实践精选集》2024版,收录了全年数位音视频专家倾情出品的

29篇技术深度Blog,期待给各位同仁带去一些思考和启发的同时,也能在AI视频世界到来

的今天,一起探索和推动AI/大模型和音视频技术融合和进化。

精选集内容将围绕火山引擎视频云在过去一年的AI/大模型音视频技术实践,包括:

●ASIC编码器、VR处理、深度学习、质量评估等全球前沿的论文精选;

●对话式AI、6DoF互动、场景重建、超低延时等前沿技术的落地实践;

●AI+教育、私域直播、短剧出海、VR大空间等行业场景的最佳实践;

CONTENTS

目录

随着信息革命的飞速发展,软件已深入人类生活的方方面面,深刻而彻底地改造了人类世界。秉承“全球专家、卓越智慧”的宗旨,我们特邀50+全球软件领域的技术领袖以及一线实战专家,融合主题演讲、互动