金融界2024年10月18日消息,国家知识产权局信息显示,上海强仝智能科技有限公司申请一项名为“一种基于深度学习的口型生成方法、装置以及存储介质”的专利,公开号 CN 118782082 A,申请日期为2024年7月。
专利摘要显示,本申请公开了一种基于深度学习的口型生成方法、装置以及存储介质。其中,方法包括:获取目标对象的音频数据,并使用预先创建的音频特征提取器提取音频数据的音频特征;将音频特征输入预先创建的编码器,确定音频特征的隐层表征;其中,隐层表征用于反映音频特征中的语音特征;将隐层表征输入预先创建的音素解码器,确定隐层表征包含的各个音素的音素权重;将音素权重和预先创建的对照表输入训练好的口型生成模型,确定目标对象的口型信息,并将口型信息转换为口型图像;其中,对照表为通过将不同的音素与对应的口型进行匹配后得到的对照表。
来源:金融界