自编码器过程
输入一个图片,经过encoder变成一个向量,再通过decoder将这个向量反向生成输入的图片。
这里我们希望输入和输出越接近越好。这个过程我们称为重建。
特点:不需要任何的标注资料。
在2006年这个思想就被提出来了:
常见变形:试图还原加入噪声之前的图片---消除噪声的功能
自编码器不仅用在图像上,也可以用在音频、文本中。
FD技术希望可以在压缩完的数据中分析出对应的信息类型。
应用场景
不可能在实现每一句话都找两个人同时发音记录,我们期望两个人记录一些对话之后就可以训练一个模型,任何语音都可以实现转化。
技术实现:
可以实现将声音和内容进行互换:
应用:Discrete Representation
应用:text as representation
可以实现摘要总结,但是这个摘要属于EN和DN之间的暗号,我们直接查看是看不懂的,所以我们应该怎么做呢?
应用:压缩技术
应用:异常检测