需要结合题库刷题,有些写的不全,看题才能看懂
通过网盘分享的文件:人工智能ACP.docx
链接: https://pan.baidu.com/s/1QaYH3vLrxmBpI7i_ahWi0A 提取码: 2580
易错知识点一
- OSS是非结构化数据存储的,MaxCompute是结构化数据的。
视觉CV图像是非结构化数据
- 视觉智能模型训练步骤;预处理、特征提取、智能模型
- Caffe最早
- 出现的次数和语料库文档总数越大表明越重要
- 语音数据常用的编码为PCM,AMR
- 录音文件识别支持单轨/双轨的WAV,MP3格式;
- 极速版支持的有AAC,MP3,OPUS,WAV
- 传统声码器有straight-vocoder,world;
- 神经声码器有wavenet,waveglow,lpcnet
- SDK支持包括Java、Python、Go、Node.js、PHP、C#六种
- 可视化方式;选择连续类型特征、枚举类型特征、分层样本采样数
- 可视化方式么有离散型特征
- 顺序型数据可以转换成类别型
- 只有BERT支持上下文建模
- 不属于pal-eas的主要功能的是模型创建
- 模型可解释性强不适于深度学习的优点
- 阿里云自然语言处理nlp自学习平台训练模型的进去额度在0.85以上
- Processor是包含在线预测逻辑的程序包
- 阿里云图像搜索技术以深度学习和机器视觉技术为核心
- Sol 脚本组件拖入画中,可以与准备数据中的数据组件进行拼接
- 8,000 Hz - 电话所用采样率, 对于人的说话已经足够
- 阿里云自然语言处理平台数据集可以进行编辑、抽样、导出、】
- 阿里云自然语言处理NLP自学习平台的数据标注任务可以进行
查看、质检、下线
- 用阿里云机器学习平台PAI的PAIAuto Leaming自动建模来实现的是
推荐召回和图片分类
- 语音处理技术主要包括语音信号处理,(特征提取),声学模型, 语音模型和解码搜索五个关键步骤。
- Word2vec的两种训练方法是CBOW、skip-gram
- 语音合成描述正确的是语音合成意味着文字信息可以实施转化为标准流畅的语音朗读出来
- 常用的深度学习框架不包括Flaask
- 求解因素序列对应的语句的概率是语言模型的作用
- 阿里云机器学习平台PAI的PAI-Studio实验的全局参数使用在
Sol组件脚本;拆分组件的切分比例
- Faster R-CNN使用了rpn
- 句法分析结果是用句法树来表示的。
- Pal底层不支持pap计算框架
- Apl 接口返回的requestld类型是string
- 阿里云人脸API,返回参数中Data的类型是struct
- Action需要取系统规定参数,取值:RunPreTrainService。
- SSD包含anchor机制生成候选区域,其他算法没有
- 图像预处理包含三种措施;图像清洗;图像增强;几何变换
- 调用GetPredictResult可以得到模型预测的结果
- GRU只有两个门分别是更新门和重置门,
- LSTM有三个门分别是遗忘门、输入门和输出门
- 长短期记忆神经网络结构主要有输入门、遗忘门和输出门三个门限函数组成。
- DOG算子是一种常用于灰度图像角点检测
- 卷积神经网络的三大结构特性是局部连接、权值 共享、空间或时间上的下采样(池化)。要由输入层、卷积层,池化(Pooling)层和全连接层组成。
- 词向量用来比较词的相似性
- 是一种简单有效的将最小语义单元 —— 词转化
- 机器学习是人工智能的基础,它的学习离不开经验数据,算法和模型
- 短文本一次不能超过300个字符
- 布料图像搜索 纹理相似
- 视觉智能平台开通与使用流程;成为开发者-能力调试-能力开通-创建AccessKey-启动开发
- 项目描述在创建项目时属于必填项目
- NLP自学习平台训练模型过程;新建项目 上传数据 创建模型 训练 测试 调用
- 信号处理范畴,混响消除,波束形成,语音增强。回声消除。噪声抑制,声源定位、音源分离
- ,。图像二值化就是将图像上的像素点的灰度值设置为0或255,这样将使整个图像呈现出明显的黑白效果。
- 目前YOLO v3算法在速度和精度上保持的均衡性最好
- 增强学习在学习器的训练前没有标记样本的结果,而需要通过尝试来得到各行为的结果,进而来对训练本身进行反馈; Q-学习,SARSA两种算
法都是机器学习增强学习方法。
- 神经网络能够将数据转化为更适合解决目标问题的特征形式,从而更加注重数据特征的学习
- 混淆矩阵是应用在有监督学习中,可以用来评估模型分类的正确性。而K均值聚类是无监督学习方法,PS线性回归和GBDT回归都是回归方法并不是分类方法,只有逻辑回归二分类是分类方法可以用混淆矩阵进行评估,故逻辑回归二分类组件。
模块知识点
常用语言
有监督学习的训练数据包含输入特征以及与之对应的标签。算法的目标是学习输入特征和标签之间的映射关系,以便对新的输入数据进行预测。常见的有监督学习算法包括线性回归、逻辑回归、决策树、支持向量机KNN SVM 随机森林等。以预测房价为例,输入特征可以是房屋的面积、房间数量、房龄等,对应的标签就是房屋的价格。算法通过学习大量这样的数据,建立起输入特征和房价之间的关系,从而对新房屋的价格进行预测。
无监督学习的训练数据仅包含输入特征,没有对应的标签。算法的任务是挖掘数据中潜在的结构、模式或关系。聚类算法 CURE便是无监督学习中的典型代表,它把数据集中相似的数据点划分到同一组(即簇),不同簇的数据点具有较大差异。比如,在电商领域对用户进行聚类,依据用户的购买行为、浏览历史等特征,将用户分成不同的群体,每个群体内的用户具有相似的消费习惯,如此有助于企业开展精准营销。
6大颜色空间包括: 1.RGB空间; 2.CMY/CMYK
颜色空间; 3.HSV/HSB颜色空间; 4.HSI/HSL颜
色空间; 5.LAB颜色空间; 6.YUV/YCbCr颜色空
间。
- 基于模型的聚类;COBWEB和神经网格算法
- 划分的聚类; K - Means 算法
- 密度;DBSCAN
- 网格;STING ; CLIQUE ;waveCluster
- 层次;CURE、BIRCH、Agglomerative、 Chameleon
- 典型;;DBSCAN;K - Medoids 算法
- 智能体:增强学习中的实体,从实验和错误中学习。
- 行为:智能体所 能采取的所有可能的行为。
- 值;智能体所期待的长期目标
- 奖励:环境对智能体 上一个行为的反馈。
- 状态(State, S) :智能体在当 前条件下所具有的性质,由环境反馈得到。
1、 基于词典的方法:基于匹配判断的方法、最大匹配法 (正向、逆向、双向)、全切分路径选择。
2、 基于统计的方法:基于序列标注的方法、BMES表示法、HMM、CRF模型。
3、 基于深度学习的方法:词向量预训练、CRF+ BiLSTM网络。
图像特征提取的目的;
1、 使算机理解图像
2、 得到非图像表示 数值和向量
3、 提取出来的飞图像表示是特征
4、 从图像中提取出来计算机能理解的信息
语音信号处理的目的:
1、理解语音是一种交流的手段
2、语音的传播和复制
3、对语音进行分析,以便自动识别和提取信息
4、发现说话者的一些生理特征
机器学习PAI子产品有PAI-Studio、PAI-DSW、PAI-DLC、PAI-EAS、AutoLearning等
- Pai-autolearning(自动建模)适用模型初学者水平人员,主要用来图像分类等模型训练。自动模型训练
PAI-EAS(模型在线部署)适用把pai-autolearning、pai-studio、Pai-dsw构建的模型发布出来供企业直接适用。Pal-eas功能不包括模型训练
- PAI-DSW(交互式建模)是一款云端机器学习开发IDE,适用于不同阶段的开发者并且集成了开源Jupyterlab,您无需任何运维配支持python2和python3编程语言,TensorFlow和PyTorch框架。可以实现机器学习算法开发置,即可进行Notebook编写、调试及运行Python
- Palstudio(拖拽式可视化建模);不支持散点图;PAI-Studio支持通过可视化或PAI命令的方式,配置该组件参数原
- PAL Studio=PAL-designer对数据进行随机拆分,用于生成训练和测试集
- Pal-DLS(分布式训练)
RESTful API请 求方式的区别POST的数据在地址栏上不可见,看上去,比GET 安全。但从传输的角度来说,POST与GET都是不安全的,因为 HTTP 在网络上是明文传输的,只要在网络节点上捉包,就能完整地获取数据报文。
在机械学习apl中,创建标注时,所需要的数据需要先开通oss
易错知识点二
- ResNet(深度残差网络)提出了残差结构,可以将梯度信息直接通过残差结构传递到浅层,避免了梯度消失问题
- Hog通过机损局部区域的梯度方向直方图来构成特征
- SSD中包含anchor机制来生成候选区域,其他算法均没有
- 双向循环神经网络包括两个神经循环网络
- 机械学习离不开数据算法和模型
- Pytorch是Facebook人工智能研究院在GitHub上开源的,采用了命令式编程和符号式编程混合方式;MXNet来自cxxnet,minerva和purine2的作者的合作,并不是Facebook发布;
- TensorFlow核心语言为C++。由Google团队设计,
- 语音的最小的基本单位是因素
- 因素是人类区域别一个单词车龄一个单词的基础
- BMES主要用于序列标注,包括分词和词性标注
- 语音识别效果也表示着语音识别技术的发展,由传统GMM到深度神经网络,再由单向LSTM到双向LSTM,再到阿里云的DF SMN。
- 语音识别包括信号处理 语音识别 语音合成
- Triplet loss 与二元交叉熵损失相比的优势是可以摆脱类别的限制;能学习到样本之间细微的差异
- 语音信号处理的常见方法:时域分析;频域分析;倒谱分析;线性预测,
- 可以作为多元线性回归模型中各个自变量的重要性评价的指标或方法的是
偏回归平方和,t检验,标准回归系数
易混淆题
拼接法;采用动态规划算法选出最优单元序列
参数法;基于时长模型和升学模型预测声学特征参数3
答案
- 出阿里云大数据计算服务maxcompute之外。还需要那种阿里云产品来支持
对象存储服务oos 机器学习api
- 训练集的作用是训练模型
- 语音信号处理常用的方法有时域分析,频域分析,倒谱分析
- 当k去哪几个值预测点的最终分类为a类型 12 13
- Google的语音识别系统并不是第一次实现中文语音识别
Klatt联合Holmes才能合成出语音
- 关于processor正确的是。除了上传模型文件
- 逻辑回归算法的优点是计算代价不高速度快适合二分类问题
模型易于理解和实现
- 常用的机器学习算法是除了卷积神经网络
- 长文本想对短文本的优势是全选
- 图像预处理的目的描述正确的是
提升视觉智能判断的准确绿 去除图像中的噪音及无效信息的干扰