什么是人工智能
Artificial Intelligence,简称AI,即人工智能,它原本是计算机科学的一个分支,旨在构建能够执行通常需要人类智能才能完成的任务的机器。人工智能使机器能够模拟人类的能力,例如理解、推理、学习、决策等。可用于包括语音识别、图像识别、内容生成、推荐系统和自动驾驶汽车等领域。
随着技术的发展,人工智能已经演变成了一门具有多种方法的跨学科科学。
人工智能用到的学科
包括计算机科学、数学、统计学、语言识别、图像识别、自然语言处理、专家系统、机器学习,计算机视觉等。在这些大学科下又有很多细分学科。
人工智能如何运作?
人工智能系统依靠算法、模型和数据来工作。
首先,建立数学模型和算法,然后算法使用大量数据进行训练和优化模型,生成的模型就具有对相关数据具有预测的能力。
前期训练完成后,AI就会被部署到各种应用程序中,在那里它们又不断学习并适应新数据,并不断地优化算法和模型。
这使得人工智能系统能够随着时间的推移以更高的准确性和效率执行图像识别、语言处理和数据分析等复杂任务。
数据和数据处理
AI的基础是大量的数据。通过收集和分析数据,AI能够发现其中的模式或规律,从而做出判断或决策。数据是训练AI模型的“燃料”,一般数据越多,AI模型训练的效果越好。数据包括:
结构化数据:如数字、时间戳、类别标签等。
非结构化数据:如文本、图像、语音等。
而数据处理则是提取、清理和准备数据的过程。数据处理技术包括数据清洗、特征提取、数据标注等。
数据清洗:比如缺失值处理(删除或使用均值、中位数、最频繁值填补)、异常值处理(一般删除),进行格式化,统一数据单位等,从而获得想要的数据格式。
数据标注:指的是对数据的属性进行描述,比如图像的类别、文本的情感等。
特质提取:对原始数据提取有意义的特征以增强模型的表现。包括特征选择、特征变换、标准化、统一化等。
数据拆分:对处理后的数据集进行分组,一般70%-80%的数据用于训练,20%-30%的数据用于验证和测试。