标签: paper

最近都说 DeepSeek R1 模型很牛，到底牛在哪里？

卓越的推理能力

数学推理：在 AIME 2024 数学竞赛中，DeepSeek R1 取得了 79.8% 的 pass@1 得分，略微超过 OpenAI-o1-1217。在 MATH-500 基准测试上，它获得了 97.3% 的高分，与 OpenAI-o1-1217 的性能相当，并且显著优于其他模型。

代码推理：在代码竞赛任务中，DeepSeek R1 展示了专家级水平，例如在 Codeforces 上获得了 2,029 Elo 评级，超过了该竞赛中 96.3% 的人类参与者。

老马啸西风2025年2月3日大约 14 分钟

DeepSeek：普通人也能玩转的AI赚钱神器！

开篇：AI时代，普通人如何抓住机遇？

很多人看到“AI工具”这个词时，第一反应可能是：“这东西是不是很高深？普通人能用好吗？”

其实不然！DeepSeek的操作门槛并不高，关键在于你是否能找到适合自己的应用场景。

今天这篇文章，我就来手把手教大家如何利用DeepSeek挣钱。

为什么选择DeepSeek？

在开始之前，我们先来了解一下DeepSeek到底是什么。

DeepSeek是一款由中国公司开发的智能助手，它不仅可以生成文字、图片，还能进行数据分析、语言翻译等多种功能。

可以参考我的文章：DeepSeek 到底牛在哪里？

老马啸西风2025年2月3日大约 4 分钟

DeepSeek R1 AI 论文翻译

摘要

我们介绍了我们的第一代推理模型，DeepSeek-R1-Zero 和 DeepSeek-R1。

DeepSeek-R1-Zero 是一个通过大规模强化学习（RL）训练的模型，且在此过程中未使用监督微调（SFT）作为预处理步骤，展现出了显著的推理能力。

通过 RL，DeepSeek-R1-Zero 自然而然地展现了许多强大且引人注目的推理行为。

然而，它也遇到了一些挑战，如可读性差和语言混杂。为了应对这些问题并进一步增强推理性能，我们推出了 DeepSeek-R1，后者在 RL 之前引入了多阶段训练和冷启动数据。DeepSeek-R1 在推理任务上的表现与 OpenAI-o1-1217 相当。

老马啸西风2025年2月3日大约 32 分钟

openai chatGPT 原理通俗介绍

引言

近年来，随着深度学习技术的不断发展，自然语言处理（NLP）领域取得了长足的进步。ChatGPT（Generative Pre-trained Transformer）作为一种先进的语言生成模型，在各类对话系统和智能助手中得到了广泛应用。

然而，尽管这些模型在生成文本方面表现出色，但如何保证生成的文本在逻辑上合理仍然是一个挑战。

本文将探讨在 ChatGPT 中如何实现逻辑，并探讨自然语言中逻辑的理解方式。

老马啸西风2024年2月20日大约 18 分钟

openai chatgpt paper-01-openai chat GPT-4 Technical Report 技术报告论文

我们报告了 GPT-4 的开发，这是一个大规模、多模态的模型，可以接受图像和文本输入，并生成文本输出。虽然在许多现实场景中不如人类，但 GPT-4 在各种专业和学术基准测试中表现出与人类水平相当的性能，包括在模拟的律师资格考试中取得了约前10%的考生得分。

GPT-4 是基于 Transformer 架构的模型，经过预训练以预测文档中的下一个标记。后训练对齐过程导致在事实性和符合所需行为方面的性能得到改善。该项目的核心组成部分是开发基础设施和优化方法，这些方法在各种规模上都能可预测地运行。

这使我们能够根据使用的计算资源不超过 GPT-4 1/1,000 的模型准确预测 GPT-4 的某些性能方面。

老马啸西风2024年2月20日大约 27 分钟

openai chatgpt paper-01-openai DALL-E 3 从文本描述生成图像原理通俗解释

序言

在数字时代，图像生成技术正日益成为人工智能领域的热点。

本讨论将重点聚焦于两个备受瞩目的模型：DALL-E和其他主流AI绘图方法。

我们将探讨它们的优势、局限性以及未来的发展方向。通过比较分析，我们期望能够更全面地了解这些技术，为未来的研究和应用提供启示。

老马啸西风2024年2月20日大约 24 分钟

openai chatgpt paper-01-openai DALL-E 3 论文 Improving Image Generation with Better Captions 提升图像生成的关键：更好的图像描述

我们展示了通过训练高度描述性的生成图像标题，可以显着改善文本到图像模型的提示跟随能力。

现有的文本到图像模型在跟随详细的图像描述方面存在困难，经常忽略单词或混淆提示的含义。

我们假设这个问题源于训练数据集中存在嘈杂和不准确的图像标题。我们通过训练定制的图像标题生成器来解决这个问题，并使用它重新为训练数据集生成标题。然后我们训练了几个文本到图像模型，并发现在这些合成标题上进行训练可靠地提高了提示跟随能力。

最后，我们利用这些发现构建了 DALL-E 3：一个新的文本到图像生成系统，并对其性能进行了基准测试，评估设计用于衡量提示跟随、连贯性和美感，发现它与竞争对手相比具有明显优势。我们发布了这些评估的样本和代码，以便未来的研究可以继续优化文本到图像系统的这一重要方面。

老马啸西风2024年2月20日大约 22 分钟

openai sora 只能根据文本生成视频？不，TA 是通用物理世界模拟器

我们探索了在视频数据上进行大规模生成模型的训练。

具体来说，我们联合在可变持续时间、分辨率和长宽比的视频和图像上训练文本条件扩散模型。

我们利用了一个在视频和图像潜在编码的时空补丁上操作的变压器架构。

我们最大的模型Sora能够生成一分钟的高保真视频。我们的结果表明，扩展视频生成模型是建立通用物理世界模拟器的有前途的途径。

TODO: 视频

PS：其他视频省略。

这份技术报告着重介绍了两个方面：

(1) 我们将各种类型的视觉数据转化为统一表示的方法，从而实现了生成模型的大规模训练；

老马啸西风2024年2月20日大约 10 分钟

NLP 中文拼写检测纠正论文-00-chinese spell checking 中文拼写纠正 CSC 论文

NLP 中文拼写检测实现思路

NLP 中文拼写检测纠正算法整理

NLP 英文拼写算法，如果提升 100W 倍的性能？

老马啸西风2020年1月20日大约 6 分钟

NLP 中文拼写检测纠正论文-01-介绍了SIGHAN 2015 拼写中文拼写检查，包括任务描述，数据准备，绩效指标和评估结果

NLP 中文拼写检测实现思路

NLP 中文拼写检测纠正算法整理

NLP 英文拼写算法，如果提升 100W 倍的性能？

老马啸西风2020年1月20日大约 12 分钟