( 一 )Matlab
1.数值计算和符号计算功能
Matlab 以矩阵作为数据操作的基本单位,它的指令表达式与数学、工程中 常用的符号、表达式十分相似,故用Matlab 来解算问题要比用C、FORTRAN 等 语 言完成相同的事情简捷得多,使学者易于学习和掌握。Matlab 还可以提供非常
丰富的数值计算函数,而且采用的都是国际通用的数值计算算法,便捷通用。
sin斤+ln(tan(1) 分析:在MATLAB中π写成pi,In写为log 上式可写成sin(pi^0.5)+log(tan(1)) 使用MATLAB实现: >>sin(pi^0.5)+log(tan(1)) ang = 1.4228 |
2.绘图功能
Matlab 绘图功能十分强大,它可以绘制各种图像,囊括了2D 和 3D 图形, 也可以对图像进行修饰控制,以增强图像的表现效果。利用Matlab 绘图十分方 便,其提供了一系列绘图函数,用户不需要过多地考虑绘图的细节,只需要给出
一些基本参数就能得到所需图形。这种方法称为高层绘图操作。
此 外 ,Matlab 也提供了直接对图形句柄进行操作的低层绘图操作。这类操 作将图形的每个图形元素(如坐标轴、曲线、文字等)看作一个独立的对象,系 统给每个对象分配一个句柄,可以通过句柄对该图形元素进行操作,而不影响其他部分。
3.汇编语言功能
Matlab 具有程序结构控制、函数调用、数据结构、输出输入等功能,不仅 简单易学,而且操作简便。因此,对于有数值结算、程序仿真、计算机辅助设计
等需求的同学们来说帮助非常大。
4.八大经典应用领域
数值分析 | 数值和符号计算 | 工程与科学绘图 | 控制系统的设计与仿真 |
数字图像处理 | 数字信号处理 | 通讯系统设计与仿真 | 财务与金融工程 |
5.实战演练
√ 数据导入
标准文件格式: 标准文件格式功能从常见文件格式中读取数据,如 Excel 、 文本、图像、音频和视频,以及科学数据格式,如图,工具栏——>主页——>导入数据。
图像文件: A=imread(filename): 从
从文件内容推断出其格式。如果 filename
件中的第一个图像。
表格文件: T=readtable('filename.xls’):
取文件名将电子表格数据读入表中。
T=readtable('patients.xls','Range','Al:E5'):
filename 指定的文件读取图像,并为多图像文件,则 imread 读取该文使 用 readtable 函数通过读通过指定范围参数来选择要导入的数据范围。例如,读取电子表格的前五行五列。请用 Excel 表示
法将范围指定为 ’A1:E5’。
√ 数据处理
拟合: 拟合在预测类题目中十分常见,如温度、销售额、人口等预测问题。
可以用matlab 中 的polyfit(x,y,n) 拟合,其中: x 和 y 是包含数据点的 x 和
y 坐标的向量; n 是要拟合的多项式的次数。
x=[12345];
y =[5.543.1128290.7498.4];
p=polyfit(x,y,3);
x2 =1:.1:5;
y2=polyval(p,x2);
plot(x,y,'o',x2,y2)
grid on
S= sprintf(y= (%.1f) x^3 + (%.1f) x^2 + (%.1f) X
(%.1f)’,p(1),p(2),p(3),p(4));
text(2,400,s)
插值: y=interp1(X,Y,X1,method);X,Y 是两个等长的已知向量,分别表示采样点和采样值; X1是一个向量或标量,表示要插值的点; method 参数表示用于插值的方法,常用的取值有以下几种方法:
1)linear: 线形插值,将与插值点靠近的两个数据点用直线连接,然后在直线上选取对应插值点的数据。
2)nearest: 最近点插值,选择最近样本点的值作为插值数据。
3)pchip: 分段3次埃尔米特插值,采用分段三次多项式,除满足插值条件, 还需满足在若干节点处相邻段插值函数的一阶导数相等,使得曲线光滑的同时,还具有保形性。
4)spline:3 次样条插值,每一个分段内构造一个三次多项式,使其插值函
数除满足插值条件外,还要求在各节点处具有连续的一阶和二阶导数。
x=[0,1,2,3,4,5,6,7,8,9];
y=[1,1.22,11.7,14.1,16.1,21.0,14.28,1.2,11.0,11.6];
x1=0:0.1:15;
yl=interp1(x,y,xl,'spline');
plot(x1,yl )
地图可视化: 地图可视化在数学建模竞赛中非常常见,大多数题目背景都涉及或多或少的地理问题,如路径规划、自然灾害预测、数据可视化展示等都可以用到,并且相较于函数图像,地图可视化效果非常美观,可以给论文增添不少美感。
tsunamis =readtable('tsunamis.xlsx');
lat =tsunamis.Latitude;
lon =tsunamis.Longitude;
weights =tsunamis.MaxHeight;
geodensityplot(lat,lon,weights)
geolimits([41.261.4],[-148.6 -107.0])
geobasemap topographic
√ 常用图像
箱线图: 箱线图为数据样本提供汇总统计量的可视化表示。对于给定数值数 据,对应的箱线图显示以下信息:中位数、下四分位数和上四分位数、任何离群
值(使用四分位差计算得出)以及不是离群值的最小值和最大值。
tbl=readtable('TemperatureData.csv') ;
month0rder =
{’January','February','March','April','May','June','July',..'Au
gust’,'September','October','November','December'};
tbl.Month =categorical(tbl.Month,monthOrder) ;
boxchart(tbl.Month,tbl.TemperatureF,'GroupByColor',tbl.Year)
ylabel(Temperature(F)’)
legend
散点图: 散点图是指在回归分析中,数据点在直角坐标系平面上的分布图, 散点图表示因变量随自变量而变化的大致趋势,据此可以选择合适的函数对数据 点进行拟合。用两组数据构成多个坐标点,考察坐标点的分布,判断两变量之间
是否存在某种关联或总结坐标点的分布模式。散点图将序列显示为一组点,值由点在图表中的位置表示,类别由图表中的不同标记表示,散点图通常用于比较跨类别的聚合数据。
x =randn(1000,1);
y=randn(1000,1)
s=scatter(x,y,'filled')distfromzero =sqrt(x.^2 +y.^2) ;
s.AlphaData =distfromzero;
s.MarkerFaceAlpha='flat’;图片
直方图: 直方图又称质量分布图,它是表示资料变化情况的一种主要工具。
用直方图可以解析出资料的规则性,比较直观地看出产品质量特性的分布状态,
对于资料分布状况一目了然,便于判断其总体质量分布情况。
y=[124367];
bar(y);
time=2020:2025;
bar(time,y)
多图展示:subplot(m,n,p) 将当前图窗划分为 m×n 网格,并在p 指定的 位置创建坐标区。Matlab 按行号对子图位置进行编号。第一个子图是第一行的 第一列,第二个子图是第一行的第二列,依此类推。如果指定的位置已存在坐标
区,则此命令会将该坐标区设为当前坐标区。
subplot(2,2,1)
x=linspace(0,10)
y1=sin(x);plot(x,y1)
title('Subplot 1:sin(x)’)
subplot(2,2,2)
y2=sin(2*x);plot(x,y2)
title('Subplot 2:sin(2x)’)
subplot(2,2,3)
y3 =sin(4*x):
plot(x,y3)
title('Subplot subplot(2,2,4) y4 =sin(8*x);
plot(x,y4)
title(Subplot
3:sin(4x)’)
4:sin(8x)’)
√ 颜色
颜色名称 | 简写 | RGB | 十六进制颜色代码 | 颜色示例 |
'red' | 'r' | [100] | '#FF0000' | |
'green | 'g' | [010] | '#00FF00' | |
'blue' | 'b' | [001] | '#000OFF' | |
cyan' | 'c' | [011] | '#0OF FFF' | |
'magenta | 'm' | [101] | '#FF0OFF' | |
'yellow | ' y | [110] | '#FFFF0O' | |
'black' | 'k' | [000] | '#000000' | |
'white' | 'w' | [111] | '#FFFFFF' | |
'none' | 不适用 | 不适用 | 不适用 | 无颜色 |
√ 线条
线型 | 说明 |
实线 | |
虚线 | |
: | 点线 |
, | 点划线 |
标记 | 说明 |
'o' | 圆圈 |
'+' | 加号 |
1*1 | 星号 |
'! | 点 |
'x' | 叉号 |
1 1 | 水平线条 |
'I | 垂直线条 |
's' | 方形 |
'd' | 萎形 |
1A1 | 上三角 |
'v' | 下三角 |
'>' | 右三角 |
'<' | 左三角 |
'p' | 五角形 |
'h' | 六角形 |
( 二 ) SPSS
1.软件介绍
(1)简介
SPSS(Statistical Product and Service Solutions), “统计产品与服 务解决方案”软件,用于统计学分析运算、数据挖掘、预测分析和决策支持任务等相关数据统计分析。
SPSS 是世界上最早采用图形菜单驱动界面的统计软件,它最突出的特点就 是操作界面友好,输出结果美观。它将几乎所有的功能都以统一、规范的界面展 现出来,使用Windows 的窗口方式展示各种管理和分析数据方法的功能,对话框 展示出各种功能选择项。用户只要掌握一定的Windows 操作技能,精通统计分析原理,就可以使用该软件为特定的科研工作服务。
(2)操作窗口
数据窗口: 也称为数据编辑器,此窗口类似于 Excel 窗 口 ,SPSS 处理数据 的主要工作全在此窗口中进行。又分为两个视图:数据视图用于显示具体的数据,一 行代表个观测个体(在 SPSS 中称为 Case), 一 列代表 一 个属性(在 SPSS 中称为 Variable); 变量视图则专门显示有关变量的信息:变量名称、类型、格式等。
CCSS_Sample.sav [数据集1]-IBM SPSS Stati | tics数据编辑器 | |||||||
文件(F)编辑(E)视图(V)数据(D)转换① | 分析也 查 | 图形(G 实用程序(U)窗 | ||||||
月份 | 身份证 | 城市 | 性别 | 年龄 | 学历 | |||
1 | 200+4 | |||||||
2 | 200704 | 2 | 100 | 1 | 24 | |||
3 | 200704 | 3 | 200 | 1 | 20 | |||
4 | 200704 | 4 | 100 | 2 | 65 | |||
5 | 200704 | 5 | 200 | 2 | 40 | |||
6 | 200704 | 6 | 100 | 1 | 50 | |||
7 | 200704 | 7 | 100 | 2 | 53 | |||
8 | 200704 | 8 | 300 | 1 | 44 | |||
9 | 200704 | 9 | 200 | 2 | 35 | |||
输出窗口: 也称为结果查看器,此窗口用于输出分析结果。整个窗口分两个 区:左边为目录区,是SPSS 分析结果的一个目录;右边是内容区,是与目录一一对应的内容。
语法窗口: 也称为语法编辑器。SPSS 最大的优势在于其简单易用性,即菜单对话框式的操作。语法编程适用于高级分析人员。
脚本窗口: SPSS 脚本是用Sax Basic 语言编写的程序,它可构建一些新的 自定义的对话框。脚本可用于使 SPSS 内部操作自动化、使结果格式自定义化、实现 SPSS新功能、将 SPSS 与VB和 VBA 兼容应用程序连接起来。
2.主 要 功 能
基本功能: SPSS 的基本功能包括数据管理、统计分析、图表分析、输出管理等等。
统计分析功能: SPSS 统计分析过程包括描述性统计、均值比较、 一 般线性 模型、相关分析、回归分析、对数线性模型、聚类分析、数据简化、生存分析、 时间序列分析、多重响应等几大类,每类中又分好几个统计过程,比如回归分析 中又分线性回归分析、曲线估计、Logistic 回 归 、Probit 回归、加权估计、两 阶段最小二乘法、非线性回归等多个统计过程,而且每个过程中又允许用户选择不同的方法及参数。
绘图功能: SPSS 也有专门的绘图系统,可以根据数据绘制各种图形。
3.SPSS 优点
(1)功能强大、简单易学
SPSS 的 优 点 是 统 计 功 能 强 大 , 操 作 简 便 ,SPSS 统计过程囊括了常用的、较 为成熟的统计模型,完全可以满足大部分的统计需求。最方便的是, SPSS 的 所 有操作都用统 一 的 窗 口 模 式 进行, 一 般步骤是选择变量、设置统计参数、输出结果,使用者甚至无需懂太多统计专业知识,用默认的设置即可完成专业的统计。
( 2 ) 在 美 赛 中 受 众 广
SPSS 作为最常使用的统计软件之 一 ,操作便捷、轻松易懂,针对初学者、熟练者及精通者都比较适用,并且很多群体只需要掌握简单的操作分析,大多青ipt Editor [design]睐于 SPSS。有它的加持,美赛团队中主要负责论文写作的队员也可以进行数据分析,在紧张的比赛时间中更快推进解题进度。
(3)数据接口
能够读取及输出多种格式的文件。比如由dBASE、FoxBASE、FoxPRO 产生的 *.dbf 文件,文本编辑器软件生成的ASCⅡ数据文件,Excel 的 * .xls 文件等均可 转换成可供分析的SPSS 数据文件。能够把 SPSS的图形转换为7种图形文件,结果可保存为*.txt 及 html 格式的文件。
(4)模块组合
SPSS for Windows软件分为若干功能模块,用户可以根据自己的分析需要和计算机的实际配置情况灵活选择。
4.SPSS 缺点
(1)可控性不强
图表输出方面, SPSS 可以通过勾选统计图表,自动输出多种精美的统计图, 方便快捷。但也因为自动输出,所以图表参数等的设计受系统限定较多,受个人的可控性不强。
(2)大量数据面临重复操作
当同一个模型需要代入大量数据多次跑结果时,若用 SPSS 类菜单型软件需 要重复点击步骤;而编程类软件只要一键点击命令文件,重新跑一边程序即可输出结果。
5.学习方法
(1)软件架构
SPSS 简单易学,软件入门基础知识需要的学习时间不多,这部分建议找一 本简明教程,花费较少时间快速了解软件的结构、功能和基本操作,即可进入后续分析模型的学习。
(2)分析模型
分析模型这部分的学习不必求全,各知识在 SPSS 中的操作知识也没有承上 启下的逻辑关系。因此,这部分的学习只需要根据自己的需求有针对性地选择学 习就可,如聚类分析、回归分析、相关分析等。这部分也不难,参考教材或者利用网络资源皆可。
(3)教材推荐
《SAS 常用统计分析教程》胡良平;
《SPSS 统计分析基础教程》&《SPSS 统计分析高级教程》张文彤。