机器学习讲座

2023 8 24 王成军 推荐教材: 教学数据:泰坦尼克号数据 特征工程与深度神经网络 数据清理 描述统计 表格、可视化 机器学习 机器学习要有监督式学习,通过测试集测试模型的效果,测试集的分数要高。防止过度拟合 scikit-learn 最常用工具包 dataframe 分类与回归 对应不同的算法 5步进行机器学习 选择一个模型, 对模型进行初始化 把数据整理成X、y(X是列表嵌套) 使用选择 …

数字人文网络资源

全面收集和整理数字人文领域的网络资源,包括研究机构、历史文献、地理信息、文学资源、语言学工具、博物馆数字化成果以及相关制作工具等,为数字人文研究和教学提供参考。

融媒体作品案例

Python中处理json数据的方法

Python操作json文件通过了两种方法:load():用于读取json文件;dump():用于写入json文件 读取json文件内容,返回字典格式 1 2 3 4 5 # 读取json文件内容,返回字典格式 with open('./source_file/info.json','r',encoding='utf8') as fp: …

AIGC

风格化生成 价值观偏差、价值观对齐 消费过程就是生成过程 从训练语料开始认证 隐私 人群偏见 新型信息茧房 意识形态风险 认知对抗升级 复旦大学认知工厂 http:///kw.fudan.edu.cn 提示工程 中国科学院信息工程研究所 虎嵩林 李鲲 生成式搜索 内容生成: 翻译 摘要 自动写作 代码生成 论文修改 使用精准的提示 多案例提示 提示工程应用 通过回答形式进行信息获取 让结果以表格形 …

css

::: {.page-container} ::: {.max-w-3xl} ::: {.course-title} ::: {.course-logo} ::: CSS ::: 简介 CSS(Cascading Style Sheets,层叠样式表),是一种用于描述HTML或XML文档的呈现方式的样式表语言。简单来说,CSS用于控制网页的布局、格式和外观。它允许您定义网页上的元素应该如何显示,例 …

JSON 数据格式详解

详细介绍JSON数据格式的语法、用法及在现代Web开发中的应用,包含实例和最佳实践。

如何升级Quarto

目前版本的Quarto不支持自更新,只能手工更新,方法如下: 到官网下载最新版,手工进行安装,注意将最新版覆盖到原有安装路径中。 还可以使用Winget之类的包管理工具,手工进行更新。 参考文献 https://github.com/quarto-dev/quarto-cli/issues/2374

论文写作检查清单

提供全面的论文写作自检清单,包括研究问题的明确性、原创性、研究方法的有效性、数据分析的准确性、写作规范性等关键要点,帮助研究者系统性地评估和提升论文质量。

Python爬虫基本流程

{#fig-python-crawler}