原文链接：http://tecdat.cn/?p=25410

通过训练具有小型中心层的多层神经网络重构高维输入向量，可以将高维数据转换为低维代码。这种神经网络被命名为自编码器_Autoencoder_。

自编码器是_非线性_降_维_ 技术用于特征的无监督学习，它们可以学习比主成分分析效果更好的低维代码，作为降低数据维数的工具。

异常心跳检测

如果提供了足够的类似于某种底层模式的训练数据，我们可以训练网络来学习数据中的模式。异常测试点是与典型数据模式不匹配的点。自编码器在重建这些数据时可能会有很高的错误率，这表明存在异常。

该框架用于使用深度自编码器开发异常检测演示。该数据集是心电图ECG 时间序列（查看文末了解数据获取方式），目标是确定哪些心跳是异常值。训练数据（20 个“好”心跳）和测试数据（为简单起见附加了 3 个“坏”心跳的训练数据），如下所示。每行代表一个心跳。

init()

PATH = os.path.expanduser("~/")

import_file(PATH + "train.csv")
import_file(PATH + "test.csv")

探索数据集。

tra.shape

# 将框架转置，将时间序列作为一个单独的列来绘制。
plot(legend=False); # 不显示图例

在训练数据中，我们有 20 个时间序列，每个序列有 210 个数据点。请注意，所有线条都很紧凑并且形状相似。重要的是要记住，在使用自编码器进行训练时，您只想使用 VALID 数据。应删除所有异常。

本站仅提供存储服务，所有内容均由用户发布，如发现有害或侵权内容，请点击举报。