Skip to content

Commit

Permalink
2024-02-09 01:52:32
Browse files Browse the repository at this point in the history
  • Loading branch information
wizardforcel committed Feb 8, 2024
1 parent 51349f0 commit 435f94c
Show file tree
Hide file tree
Showing 86 changed files with 390 additions and 422 deletions.
2 changes: 1 addition & 1 deletion totrans/dl-cb_01.md
Original file line number Diff line number Diff line change
@@ -1,4 +1,4 @@
# 第一章 工具和技术
# 第一章工具和技术

在本章中,我们将介绍深度学习的常见工具和技术。这是一个很好的章节,可以通读一次以了解各种情况,并在需要时回头查看。

Expand Down
2 changes: 1 addition & 1 deletion totrans/dl-cb_02.md
Original file line number Diff line number Diff line change
@@ -1,4 +1,4 @@
# 第二章摆脱困境
# 第二章摆脱困境

深度学习模型经常被视为黑匣子;我们在一端输入数据,另一端输出答案,而我们不必太关心网络是如何学习的。虽然深度神经网络确实擅长从复杂输入数据中提取信号,但将这些网络视为黑匣子的反面是,当事情陷入困境时并不总是清楚该怎么办。

Expand Down
2 changes: 1 addition & 1 deletion totrans/dl-cb_03.md
Original file line number Diff line number Diff line change
@@ -1,4 +1,4 @@
# 第三章使用单词嵌入计算文本相似性
# 第三章使用单词嵌入计算文本相似性

###### 提示

Expand Down
2 changes: 1 addition & 1 deletion totrans/dl-cb_04.md
Original file line number Diff line number Diff line change
@@ -1,4 +1,4 @@
# 第四章基于维基百科外部链接构建推荐系统
# 第四章基于维基百科外部链接构建推荐系统

推荐系统传统上是根据用户先前收集的评分进行训练的。我们希望预测用户的评分,因此从历史评分开始似乎是一个自然的选择。然而,这要求我们在开始之前有一个大量的评分集,并且不允许我们对尚未评分的新项目做出良好的工作。此外,我们故意忽略了我们对项目的元信息。

Expand Down
2 changes: 1 addition & 1 deletion totrans/dl-cb_05.md
Original file line number Diff line number Diff line change
@@ -1,4 +1,4 @@
# 第五章 生成类似示例文本风格的文本
# 第五章生成类似示例文本风格的文本

在本章中,我们将看看如何使用递归神经网络(RNN)生成类似文本体的文本。这将产生有趣的演示。人们已经使用这种类型的网络生成从婴儿姓名到颜色描述等各种内容。这些演示是熟悉递归网络的好方法。RNN 也有它们的实际用途——在本书的后面,我们将使用它们来训练聊天机器人,并基于收集的播放列表构建音乐推荐系统,RNN 已经被用于生产中跟踪视频中的对象。

Expand Down
2 changes: 1 addition & 1 deletion totrans/dl-cb_06.md
Original file line number Diff line number Diff line change
@@ -1,4 +1,4 @@
# 第六章问题匹配
# 第六章问题匹配

我们现在已经看到了一些示例,说明我们如何构建和使用词嵌入来比较术语。自然而然地,我们会问如何将这个想法扩展到更大的文本块。我们能否为整个句子或段落创建语义嵌入?在本章中,我们将尝试做到这一点:我们将使用来自 Stack Exchange 的数据为整个问题构建嵌入;然后我们可以使用这些嵌入来查找相似的文档或问题。

Expand Down
2 changes: 1 addition & 1 deletion totrans/dl-cb_07.md
Original file line number Diff line number Diff line change
@@ -1,4 +1,4 @@
# 第七章建议表情符号
# 第七章建议表情符号

在本章中,我们将构建一个模型,根据一小段文本建议表情符号。我们将首先基于一组带有各种情感标签的推文开发一个简单的情感分类器,如快乐、爱、惊讶等。我们首先尝试一个贝叶斯分类器,以了解基线性能,并查看这个分类器可以学到什么。然后我们将切换到卷积网络,并查看各种调整这个分类器的方法。

Expand Down
2 changes: 1 addition & 1 deletion totrans/dl-cb_08.md
Original file line number Diff line number Diff line change
@@ -1,4 +1,4 @@
# 第八章序列到序列映射
# 第八章序列到序列映射

在本章中,我们将研究使用序列到序列网络来学习文本片段之间的转换。这是一种相对较新的技术,具有诱人的可能性。谷歌声称已经通过这种技术大大改进了其 Google 翻译产品;此外,它已经开源了一个版本,可以纯粹基于平行文本学习语言翻译。

Expand Down
2 changes: 1 addition & 1 deletion totrans/dl-cb_09.md
Original file line number Diff line number Diff line change
@@ -1,4 +1,4 @@
# 第九章重用预训练的图像识别网络
# 第九章重用预训练的图像识别网络

图像识别和计算机视觉是深度学习取得重大影响的领域之一。拥有几十层甚至超过一百层的网络已经被证明在图像分类任务中非常有效,甚至超过了人类。

Expand Down
2 changes: 1 addition & 1 deletion totrans/dl-cb_10.md
Original file line number Diff line number Diff line change
@@ -1,4 +1,4 @@
# 第十章构建反向图像搜索服务
# 第十章构建反向图像搜索服务

在前一章中,我们看到如何在我们自己的图像上使用预训练网络,首先通过在网络顶部运行分类器,然后在一个更复杂的示例中,我们只训练网络的部分来识别新的图像类别。在本章中,我们将使用类似的方法来构建一个反向图像搜索引擎,或者通过示例搜索。

Expand Down
2 changes: 1 addition & 1 deletion totrans/dl-cb_11.md
Original file line number Diff line number Diff line change
@@ -1,4 +1,4 @@
# 第十一章检测多个图像
# 第十一章检测多个图像

在之前的章节中,我们看到了如何使用预训练分类器来检测图像并学习新的类别。然而,在所有这些实验中,我们总是假设我们的图像中只有一件事情要看。在现实世界中,情况并非总是如此——例如,我们可能有一张既有猫又有狗的图像。

Expand Down
2 changes: 1 addition & 1 deletion totrans/dl-cb_12.md
Original file line number Diff line number Diff line change
@@ -1,4 +1,4 @@
# 第十二章 图像风格
# 第十二章图像风格

在本章中,我们将探讨一些技术,以可视化卷积网络在分类图像时看到的内容。我们将通过反向运行网络来实现这一点——而不是给网络一个图像并询问它是什么,我们告诉网络要看到什么,并要求它以一种使检测到的物品更夸张的方式修改图像。

Expand Down
2 changes: 1 addition & 1 deletion totrans/dl-cb_13.md
Original file line number Diff line number Diff line change
@@ -1,4 +1,4 @@
# 第十三章使用自动编码器生成图像
# 第十三章使用自动编码器生成图像

在第五章中,我们探讨了如何生成文本,以某个现有语料库的风格为基础,无论是莎士比亚的作品还是 Python 标准库中的代码,而在第十二章中,我们研究了通过优化预训练网络中通道的激活来生成图像。在本章中,我们将结合这些技术并在其基础上生成基于示例的图像。

Expand Down
2 changes: 1 addition & 1 deletion totrans/dl-cb_14.md
Original file line number Diff line number Diff line change
@@ -1,4 +1,4 @@
# 第十四章使用深度网络生成图标
# 第十四章使用深度网络生成图标

在上一章中,我们看了一下从 Quick Draw 项目生成手绘草图和从 MNIST 数据集生成数字。在本章中,我们将尝试三种类型的网络来完成一个稍微具有挑战性的任务:生成图标。

Expand Down
2 changes: 1 addition & 1 deletion totrans/dl-cb_15.md
Original file line number Diff line number Diff line change
@@ -1,4 +1,4 @@
# 第十五章音乐和深度学习
# 第十五章音乐和深度学习

这本书中的其他章节都是关于图像或文本的处理。这些章节代表了深度学习研究中媒体的平衡,但这并不意味着声音处理不是有趣的,我们在过去几年中也看到了一些重大进展。语音识别和语音合成使得像亚马逊 Alexa 和谷歌 Home 这样的家庭助手成为可能。自从 Siri 推出以来,那个老的情景喜剧笑话中电话拨错号码的情节并不是很现实。

Expand Down
2 changes: 1 addition & 1 deletion totrans/dl-cb_16.md
Original file line number Diff line number Diff line change
@@ -1,4 +1,4 @@
# 第十六章生产机器学习系统
# 第十六章生产机器学习系统

构建和训练模型是一回事;在生产系统中部署您的模型是另一回事,通常被忽视。在 Python 笔记本中运行代码很好,但不是为 web 客户端提供服务的好方法。在本章中,我们将看看如何真正开始运行。

Expand Down
10 changes: 5 additions & 5 deletions totrans/dl-fin_0.md
Original file line number Diff line number Diff line change
@@ -1,4 +1,4 @@
# 第一章介绍数据科学和交易
# 第一章介绍数据科学和交易

开始学习复杂主题的最佳方法是逐渐建立动力,直到你开始完成拼图。了解金融深度学习需要对基本和中级数据科学主题以及金融市场及其结构有一定的了解。

Expand Down Expand Up @@ -70,7 +70,7 @@

*数值数据*

这种类型的数据由反映在定期或不定期间隔内收集的某种类型信息的数字组成。示例可以包括市场数据(OHLC^(1),成交量,价差等)和财务报表数据(资产,收入,成本等)。
这种类型的数据由反映在定期或不定期间隔内收集的某种类型信息的数字组成。示例可以包括市场数据(OHLC¹,成交量,价差等)和财务报表数据(资产,收入,成本等)。

*分类数据*

Expand Down Expand Up @@ -509,8 +509,8 @@ plt.legend()

如果您需要 Python 的复习,请参阅第三章,这是一个基本介绍。它为书中接下来要讲的内容奠定了基础。您不需要成为 Python 大师来进行数据科学,但您必须理解代码及其引用的内容,尤其是如何调试和检测代码中的错误。

^(1) OHLC 指的是市场数据的四个基本部分:开盘价、最高价、最低价和收盘价。
¹ OHLC 指的是市场数据的四个基本部分:开盘价、最高价、最低价和收盘价。

^(2) 我之所以说是暗示的是因为必须通过统计检查来验证平稳性,您将在下一章中看到。目前,假设是对数据进行差分运算得到平稳时间序列。
² 我之所以说是暗示的是因为必须通过统计检查来验证平稳性,您将在下一章中看到。目前,假设是对数据进行差分运算得到平稳时间序列。

^(3) Rish 算法是一种用于找到反导数的不定积分技术。
³ Rish 算法是一种用于找到反导数的不定积分技术。
2 changes: 1 addition & 1 deletion totrans/dl-fin_1.md
Original file line number Diff line number Diff line change
@@ -1,4 +1,4 @@
# 第二章深度学习的基本概率方法
# 第二章深度学习的基本概率方法

技术的兴起和可访问性使每个人都能够部署机器学习和深度学习算法进行数据分析和优化。但不幸的是,这意味着许多用户不了解不同学习模型的基础和基础知识。这使得机器学习对他们来说简直就是一个黑匣子,这是一场灾难的前兆。

Expand Down
4 changes: 2 additions & 2 deletions totrans/dl-fin_2.md
Original file line number Diff line number Diff line change
@@ -1,4 +1,4 @@
# 第三章描述性统计和数据分析
# 第三章描述性统计和数据分析

*描述性统计*是描述数据并尽可能多地从中提取信息的领域。基本上,描述性统计可以像数据的代表一样,因为它概括了数据的倾向、行为和趋势。

Expand Down Expand Up @@ -1543,4 +1543,4 @@ p-value: 0.010000 `# with trend consideration`

能够进行数据分析是部署正确算法以预测时间序列未来值的关键。通过来自统计学领域的各种工具来理解数据。确保您了解什么是平稳性和相关性,因为它们在建模中提供极其有价值的见解。

^(1) 其他方式也有,但这两种方式是最流行的表示形式。
¹ 其他方式也有,但这两种方式是最流行的表示形式。
4 changes: 2 additions & 2 deletions totrans/dl-fin_3.md
Original file line number Diff line number Diff line change
@@ -1,4 +1,4 @@
# 第四章. 深度学习的线性代数和微积分
# 第四章深度学习的线性代数和微积分

代数和微积分是数据科学的支柱,特别是基于这两个数学领域的概念的学习算法。本章以一种所有人都能理解的方式介绍了一些关键的代数和微积分主题。

Expand Down Expand Up @@ -1254,4 +1254,4 @@ x 轴和 y 轴是垂直线,指定了平面的边界以及二维笛卡尔坐标

到目前为止,您应该已经对数据科学和数学要求有一定的了解,这将让您舒适地开始。

^(1) 矩阵也可以包含符号和表达式,但为了简单起见,让我们坚持使用数字。
¹ 矩阵也可以包含符号和表达式,但为了简单起见,让我们坚持使用数字。
12 changes: 6 additions & 6 deletions totrans/dl-fin_4.md
Original file line number Diff line number Diff line change
@@ -1,4 +1,4 @@
# 第五章介绍技术分析
# 第五章介绍技术分析

技术分析提供了许多类型的输入,可以用于您的深度学习模型。本章介绍了这一广阔领域,以便您具备在接下来的章节中创建基于技术的学习模型所需的知识。

Expand Down Expand Up @@ -144,7 +144,7 @@

反向指标

用于淡化移动^(2),最好在横向市场中使用^(3),因为它们通常标志着初始移动的结束。因此,它们与移动的预期逆转有关(因此也与移动的反持续性有关)。
用于淡化移动²,最好在横向市场中使用³,因为它们通常标志着初始移动的结束。因此,它们与移动的预期逆转有关(因此也与移动的反持续性有关)。

接下来的章节介绍了技术分析的两个支柱:移动平均线(趋势跟踪)和相对强弱指数(反向)。

Expand Down Expand Up @@ -320,10 +320,10 @@

技术分析提供了一系列工具来对市场进行数学、图形或甚至心理(通过模式)分析。这一章标志着在开始本书的真正目的之前进行热身练习的结束,即用于交易和预测目的的机器和深度学习应用。这一章的学习成果应该是对技术分析是什么以及其局限性的深刻理解。同样,你还应该对我提出的两个主要技术指标有深刻的理解:移动平均线和相对强弱指标,因为它们构成了即将出现的模型的关键特征。

^(1) 这假设了一个长期显示确定性特征的非随机概率。
¹ 这假设了一个长期显示确定性特征的非随机概率。

^(2) 反向操作是一种交易技术,你在与正在进行的趋势相反的方向进行交易,希望能够把握其结束的时机。
² 反向操作是一种交易技术,你在与正在进行的趋势相反的方向进行交易,希望能够把握其结束的时机。

^(3) 横盘市场通常处于均衡状态,没有特定的趋势描述它们。它们往往在彼此接近的高点和低点之间摇摆。
³ 横盘市场通常处于均衡状态,没有特定的趋势描述它们。它们往往在彼此接近的高点和低点之间摇摆。

^(4) 参见 J.韦尔斯·怀尔德(1978)的《技术交易系统中的新概念》,由趋势研究出版。
参见 J.韦尔斯·怀尔德(1978)的《技术交易系统中的新概念》,由趋势研究出版。
2 changes: 1 addition & 1 deletion totrans/dl-fin_5.md
Original file line number Diff line number Diff line change
@@ -1,4 +1,4 @@
# 第六章数据科学的 Python 入门
# 第六章数据科学的 Python 入门

在深入机器和深度学习领域之前还有一个停留。对于有经验的 Python 开发人员来说,本章是可选的,但对于没有扎实编程背景的任何人来说都是至关重要的。了解算法背后的直觉是一个很大的优势,但如果未能正确实现它们,这将无法让您走得更远。毕竟,这些算法需要代码来工作,而不是手动操作。确保了解基本语法以及如何操作数据和转换数据。

Expand Down
4 changes: 2 additions & 2 deletions totrans/dl-lfsci_01.md
Original file line number Diff line number Diff line change
@@ -1,4 +1,4 @@
# 第一章为什么选择生命科学?
# 第一章为什么选择生命科学?

虽然有许多技术倾向和对数据的热情可以追求的方向,但很少有领域能与生物医学研究的基本影响相匹配。现代医学的出现从根本上改变了人类存在的本质。在过去 20 年里,我们已经看到了许多创新,这些创新已经改变了无数个体的生活。当 HIV/AIDS 首次出现在 1981 年时,这是一种基本上致命的疾病。抗逆转录病毒疗法的持续发展已经显著延长了发达国家患者的预期寿命。其他疾病,如肝炎 C,在十年前被认为基本上无法治愈,现在可以治愈。遗传学的进步使得能够识别并希望很快治疗各种疾病。诊断和仪器的创新使得医生能够具体识别和针对人体内的疾病。许多这些突破受益于并将继续受到计算方法的推动。

Expand Down Expand Up @@ -56,4 +56,4 @@

本书的最后一章探讨了深度学习在生命科学中的当前影响和未来潜力。讨论了当前努力面临的一些挑战,包括数据集的可用性和质量。我们还强调了在诊断、个性化医学、制药开发和生物学研究等许多其他领域中的机遇和潜在风险。

^(1) Furbush, James. “Machine Learning: A Quick and Simple Definition.” [*https://www.oreilly.com/ideas/machine-learning-a-quick-and-simple-definition*](https://www.oreilly.com/ideas/machine-learning-a-quick-and-simple-definition). 2018.
¹ Furbush, James. “Machine Learning: A Quick and Simple Definition.” [*https://www.oreilly.com/ideas/machine-learning-a-quick-and-simple-definition*](https://www.oreilly.com/ideas/machine-learning-a-quick-and-simple-definition). 2018.
2 changes: 1 addition & 1 deletion totrans/dl-lfsci_02.md
Original file line number Diff line number Diff line change
@@ -1,4 +1,4 @@
# 第二章深度学习简介
# 第二章深度学习简介

本章的目标是介绍深度学习的基本原理。如果您已经有很多深度学习经验,可以随意略读本章,然后继续下一章。如果您经验较少,应该仔细学习本章,因为它涵盖的内容对于理解本书的其余部分至关重要。

Expand Down
2 changes: 1 addition & 1 deletion totrans/dl-lfsci_03.md
Original file line number Diff line number Diff line change
@@ -1,4 +1,4 @@
# 第三章使用 DeepChem 进行机器学习
# 第三章使用 DeepChem 进行机器学习

本章简要介绍了使用 DeepChem 进行机器学习的内容,DeepChem 是建立在 TensorFlow 平台之上的库,旨在促进在生命科学领域中使用深度学习。DeepChem 提供了大量适用于生命科学应用的模型、算法和数据集。在本书的其余部分,我们将使用 DeepChem 来进行案例研究。

Expand Down
4 changes: 2 additions & 2 deletions totrans/dl-lfsci_04.md
Original file line number Diff line number Diff line change
Expand Up @@ -315,10 +315,10 @@ highlightAtomLists=match_list)

###### 图 4-14。与 SMARTS 表达式“C[C,N,O]C”匹配的分子。

SMARTS 还有很多内容超出了这个简短介绍的范围。建议感兴趣的读者阅读“Daylight Theory Manual”以深入了解 SMILES 和 SMARTS。^(1) 正如我们将在第十一章中看到的,SMARTS 可以用于构建复杂的查询,以识别在生物测定中可能存在问题的分子。
SMARTS 还有很多内容超出了这个简短介绍的范围。建议感兴趣的读者阅读“Daylight Theory Manual”以深入了解 SMILES 和 SMARTS。¹ 正如我们将在第十一章中看到的,SMARTS 可以用于构建复杂的查询,以识别在生物测定中可能存在问题的分子。

# 结论

在这一章中,您已经学习了分子机器学习的基础知识。在简要回顾基础化学知识之后,我们探讨了分子在计算系统中传统的表示方法。您还学习了图卷积,这是一种在深度学习中对分子建模的较新方法,并看到了如何使用机器学习来预测重要物理性质的完整工作示例。这些技术将成为后续章节构建的基础。

^(1) Daylight Chemical Information Systems, Inc. “Daylight Theory Manual.” [*http://www.daylight.com/dayhtml/doc/theory/*](http://www.daylight.com/dayhtml/doc/theory/). 2011.
¹ Daylight Chemical Information Systems, Inc. “Daylight Theory Manual.” [*http://www.daylight.com/dayhtml/doc/theory/*](http://www.daylight.com/dayhtml/doc/theory/). 2011.
2 changes: 1 addition & 1 deletion totrans/dl-lfsci_05.md
Original file line number Diff line number Diff line change
@@ -1,4 +1,4 @@
# 第五章 生物物理机器学习
# 第五章生物物理机器学习

在本章中,我们将探讨如何使用深度学习来理解生物物理系统。特别是,我们将深入探讨如何预测类似药物的小分子如何与人体中感兴趣的蛋白质结合。

Expand Down
4 changes: 2 additions & 2 deletions totrans/dl-lfsci_06.md
Original file line number Diff line number Diff line change
@@ -1,4 +1,4 @@
# 第六章基因组学的深度学习
# 第六章基因组学的深度学习

每个生物体的核心是其基因组:包含制造生物体工作部分的所有指令的 DNA 分子。如果一个细胞是一台计算机,那么它的基因组序列就是它执行的软件。如果 DNA 可以被视为软件,信息是计算机处理的,那么我们肯定可以使用我们自己的计算机来分析这些信息并理解它是如何运作的?

Expand Down Expand Up @@ -306,4 +306,4 @@ for i in range(20):

与生命科学的大多数其他领域相比,基因组学产生了大量的实验数据。例如,单个人类基因组序列包含超过 60 亿个碱基。传统的统计技术很难在所有这些数据中找到信号。它们经常需要简化假设,这些假设并不能反映基因组调控的复杂性。深度学习非常适合处理这些数据,并推动我们对生命细胞核心功能的理解。

^(1) Huesken, D., J. Lange, C. Mickanin, J. Weiler, F. Asselbergs, J. Warner, B. Meloon, S. Engel, A. Rosenberg, D. Cohen, M. Labow, M. Reinhardt, F. Natt, and J. Hall, “Design of a Genome-Wide siRNA Library Using an Artificial Neural Network.” *Nature Biotechnology* 23:995–1001\. 2005\. *[`doi.org/10.1038/nbt1118`](https://doi.org/10.1038/nbt1118)*.
¹ Huesken, D., J. Lange, C. Mickanin, J. Weiler, F. Asselbergs, J. Warner, B. Meloon, S. Engel, A. Rosenberg, D. Cohen, M. Labow, M. Reinhardt, F. Natt, and J. Hall, “Design of a Genome-Wide siRNA Library Using an Artificial Neural Network.” *Nature Biotechnology* 23:995–1001\. 2005\. *[`doi.org/10.1038/nbt1118`](https://doi.org/10.1038/nbt1118)*.
Loading

0 comments on commit 435f94c

Please sign in to comment.