北京冬奥会第七版竞赛日程发布

新华社北京11月18日电(记者姬烨、王梦、汪涌)经国际奥委会批准,北京冬奥组委日前发布北京2022年冬奥会第七版竞赛日程。随着筹备工作的深入,北京冬奥会竞赛日程仍可能调整。

北京冬奥会将于2022年2月4日至20日举行,共设7个大项、15个分项、109个小项。相比2018年平昌冬奥会,北京冬奥会新增7个小项,分别是:女子单人雪车、短道速滑混合团体接力、跳台滑雪混合团体、自由式滑雪空中技巧混合团体、自由式滑雪男子大跳台、自由式滑雪女子大跳台和单板滑雪障碍追逐混合团体。

该工具包可以通过pip安装,

为了展示工具包中的一些特性,我们将利用scikit-learn中的红酒识别数据集。这个数据集包含13个特征以及3个目标类别。可以通过scikit-learn直接加载。在下面的代码里我引入数据集,并把转换成pandas dataframe。数据集可以直接被用来训练模型,并不需要其他的数据处理。

下面让我们利用MLxtend来比较Ensemble后的分类器的分类边界与组成他的子分类器的分类边界有什么不同。

默认的,`show_weights`方法采用GAIN来计算权重,但你也可以传入其他`importance_type`来控制特征重要性的计算。

人的能力包括体力、智力和创造力,而创造力是人类最重要的能力。目前人类的体力已经被机器战胜;人类的智力也正在被人工智能战胜,AlphaGo战胜了所有的围棋高手便是一个很好的例子。尽管如此,AlphaGo却没有创造力去设计围棋。德国著名学者洪堡认为,大学不仅要传授知识,更要“发展”知识。今天的社会正处在百年未有之大变局中,大数据、人工智能、基因编辑等颠覆性的前沿科技不断涌现,构成了这个时代的标签,也加快了大学教育创新的脚步。一流大学要求老师能以解决科技重大问题、服务社会重大需求为己任,将学生培养成为卓越一流的“领导者”为育人要义。大学将赋予你们基于兴趣的学习选择自由;让你们有施展才华的机会,通过实践产生思想的碰撞和方法的创新;让你们从对老师的依赖中解放出来,学会独立思考,掌握科学思维,培养价值判断。

由于对人工智能偏见的担心日益凸显,从业者解释模型产出的预测结果的能力以及解释模型自身运作机制的能力变的越来越重要。幸运的是,已经有许多python工具集被开发出来,用以解决上述问题。下文我将对现有4个建立的比较完善的翻译和解释机器学习模型的工具包做简要的指导性描述。

(责编:孙竞、王政淇)

这个工具包包含一系列机器学习可用的工具函数。包括通过stacking和voting构建的分类器,模型的评估,特征的提取、特征工程和可视化。除了该工具包的文档,这篇论文也是理解工具包更多细节的好资源。

让我们看几个简短的例子。

下面的可视化工具一次只能接受两个特征作为输入,所以我们创建了数组[‘proline’, ‘color_intensity’]。因为这两个特征在上述利用ELI5分析时,具有最高的特征重要性。

LIME(模型无关局部可解释)是一个用来解释模型做出的预测的工具包。LIME支持对多种分类器的单个样本预测进行解释,并且原生支持scikit-learn。

团队成员有大数据专家、算法工程师、图像处理工程师、产品经理、产品运营、IT咨询人、在校师生;志愿者们来自IBM、AVL、Adobe、阿里、百度等知名企业,北大、清华、港大、中科院、南卡罗莱纳大学、早稻田大学等海内外高校研究所。

LIME可以用pip进行安装

以上绝对不是模型可解释和可视化工具包的完整列表。这篇博文罗列了包含其他有用的工具包的列表,值得一试。

以我个人为例,我从本科到博士都在浙江大学求是园中度过。浙大厚实的本科基础课教学让我第一次感悟到数学对事物的精确表述、对逻辑的完美演绎,感悟到自然和科学之美,激起了我出于好奇心而产生的求知欲。研究生阶段我跟随曾国熙等导师研究岩土工程,先生倡导的理论、试验和工程实践相结合的研究思想,科学地诠释了对真理的探求、质疑、验证及应用,他们的言传身教使我学会了做人、做事、做学问的基本道理和方法。十年求学,塑造了我健康向上的人格、科学严谨的思维、纯粹好奇心驱动的探索精神、发现和解决问题的能力,这支持着我现在投身于祖国的建设事业,让自己的人生更有价值,更有梦想。

这个可视化工具覆盖了模型选择,特征重要性和模型性能分析等方面。

短道速滑比赛将有6个比赛日。花样滑冰12个比赛单元中有5个是在晚上进行比赛。由于滑雪大跳台场地在北京赛区,其他单板滑雪和自由式滑雪的项目在张家口赛区,因此大跳台和坡面障碍技巧兼项的运动员需要在北京赛区和张家口赛区之间进行转换。

随后,我们利用explainer解释指定样本的预测结果。其结果如下。LIME通过可视化的结果,展示特征如果对得到的预测结果产生影响。

利用scikit-learn进一步将数据分为测试集合和训练集。

根据第七版竞赛日程,北京冬奥会共有19个比赛日。最早的比赛是开幕式前2天进行的冰壶混合双人循环赛;开幕式前1天将举行冰壶混合双人循环赛、冰球女子预赛和自由式滑雪男子/女子雪上技巧资格赛;开幕式当天将举行花样滑冰团体赛的男单短节目、女单短节目和冰舞韵律舞,冰壶混合双人循环赛和冰球女子预赛;闭幕式当天将举行冰球男子决赛、冰壶女子决赛、四人雪车决赛、越野滑雪女子30公里集体出发决赛以及花样滑冰的表演滑。

同样MLxtend也可以通过pip安装。

雷锋网雷锋网(公众号:雷锋网)

雷锋网版权文章,。详情见转载须知。

同学们,你们马上要迎来人生的重要转变,从一名单纯习得知识的学生,步入到一个可以与社会主动接触、共享资源的平台,个人角色和社会角色交叉融合,这将是你们面临的一个重要考验。你们在大学里将获得心灵的净化、品行的修为和对事物的判断能力,成为有高尚品格和家国情怀的人。

这个工具包本质上,是scikit-learn的一个扩展,提供了一些非常实用且好看的机器学习模型可视化工具。`visualiser`对象是核心接口,是一个scikit-learn估计器,所以如果你之前熟悉scikit-learn的工作流程,那么将对此非常熟悉。

如果,你也是位热爱分享的AI爱好者。欢迎与雷锋字幕组一起,学习新知,分享成长。

雷锋字幕组是一个由 AI 爱好者组成的翻译团队,汇聚五百多位志愿者的力量,分享最新的海外AI资讯,交流关于人工智能技术领域的行业变革与技术创新的见解。

现在,我们拟合一个随机森林分类器,并通过另一个visualiser评价其性能。

让我们用ELI5来观察一下上面我们训练的模型的特征重要性。

接下来,我们创建一些分类器,并在训练数据上进行拟合,通过MLxtend可视化他们的决策边界。输出来自下面的代码。

首先我们构建explainer,它通过训练数据集数组,模型中用到的特征名称和目标变量的类别名称作为初始化参数。

下面让我们用LIME对上述我们训练的模型的一些预测进行解释。

也可以通过`show_prediction`来观察某一个样本的预测结果的原因。

ELI5是另一个可视化工具包,在模型机器学习模型调试和解释其产出的预测结果方面非常有用。它能够同大多数通用的python机器学习工具包一起使用,包括scikit-learn和XGBoost,以及Keras。

同学们,希望你们能博采众长,时刻保持开放的学习态度;希望你们能集思广益,在完善知识结构的时候,时刻牢记锻炼自己解决问题的能力;希望你们能海纳百川,拥有多种文化的鉴赏能力,学会更加理解,更加包容,更加关爱自己、关爱他人、关爱这个世界。大学生活无限美好,真心祝福你们可以迈好这一步,享受绚烂的青春时光,为你们精彩的人生奠定坚实的基础!

这些工具包都可以通过pip来进行安装,拥有完善的文档,并且强调通过可视化来提升可解释性。

接下来,我们创建一个lambda函数,它表示用模型预测一个样本。详见这个优秀的,更有深度的LIME教程。