Glossary

浏览 Glossary 分类中的所有内容

Glossary

MXNet

Apache MXNet 是一个开源深度学习框架,专为高效且灵活地训练和部署深度神经网络而设计。它以可扩展性、混合编程模式以及多语言支持而闻名,使研究人员和开发者能够构建先进的人工智能解决方案。

1 分钟阅读
Glossary

NLTK

自然语言工具包(NLTK)是一套全面的 Python 库和程序,专为符号和统计自然语言处理(NLP)而设计。在学术界和工业界广泛应用,提供分词、词干提取、词形还原、词性标注等多种工具。

2 分钟阅读
Glossary

NSFW(不适合在工作场所观看)

NSFW 是“不适合在工作场所观看”(Not Safe For Work)的缩写,是一种网络用语,用于标识在公共或职业场合观看可能不合适或令人反感的内容。这一标记是对内容的警告,表明其中可能包含裸露、性内容、暴力画面、粗俗语言或其他在工作场所或学校等环境中不适宜出现的敏感话题。

1 分钟阅读
Glossary

NumPy

NumPy 是一个开源的 Python 库,对于数值计算至关重要,提供高效的数组操作和数学函数。它支持科学计算、数据科学和机器学习流程,通过实现快速、大规模的数据处理。

2 分钟阅读
Glossary

OpenAI

OpenAI 是一家领先的人工智能研究机构,以开发 GPT、DALL·E 和 ChatGPT 而闻名,致力于为人类创造安全且有益的通用人工智能(AGI)。

1 分钟阅读
Glossary

Pandas(熊猫)

Pandas 是一个开源的 Python 数据处理与分析库,以其多功能性、强大的数据结构和在处理复杂数据集时的易用性而著称。它是数据分析师和数据科学家的基石,支持高效的数据清洗、转换与分析。

2 分钟阅读
Glossary

Pathways 语言模型(PaLM)

Pathways 语言模型(PaLM)是谷歌推出的先进大型语言模型家族,专为文本生成、推理、代码分析和多语言翻译等多种应用而设计。PaLM 基于 Pathways 计划构建,具有卓越的性能、可扩展性和负责任的 AI 实践。

1 分钟阅读
Glossary

Perplexity AI

Perplexity AI 是一款先进的 AI 驱动搜索引擎与对话工具,利用自然语言处理和机器学习,能够为用户提供带有引用的精准、具备上下文的答案。非常适合科研、学习和专业用途,它集成了多种大型语言模型和信息来源,实现了准确、实时的信息检索。

1 分钟阅读
Glossary

Plotly

Plotly 是一个先进的开源图形库,可在线创建交互式、出版级的图表。兼容 Python、R 和 JavaScript,Plotly 使用户能够实现复杂的数据可视化,并支持多种图表类型、交互性和网页应用集成。

1 分钟阅读
Glossary

PyTorch

PyTorch 是由 Meta AI 开发的开源机器学习框架,以其灵活性、动态计算图、GPU 加速和无缝的 Python 集成而著称。它广泛应用于深度学习、计算机视觉、自然语言处理和科研领域。

2 分钟阅读
Glossary

Q学习

Q学习是人工智能(AI)和机器学习中的一个基础概念,尤其在强化学习领域。它使智能体能够通过与环境的交互和通过奖励或惩罚获得反馈,逐步学习最优的行为,从而随着时间提升决策能力。

1 分钟阅读
Glossary

ROC曲线

接收者操作特征(ROC)曲线是一种图形表示方式,用于评估二分类器系统在不同判别阈值下的性能。该曲线起源于二战期间的信号检测理论,如今在机器学习、医学和人工智能等领域成为模型评估的重要工具。

2 分钟阅读
Glossary

ROUGE 分数

ROUGE 分数是一组用于评估机器生成摘要和翻译质量的指标,通过与人类参考进行比较。在自然语言处理领域广泛使用,ROUGE 衡量内容重叠和召回,有助于评估摘要和翻译系统。

3 分钟阅读
Glossary

Scikit-learn

Scikit-learn 是一个功能强大的开源 Python 机器学习库,提供简单高效的工具用于预测性数据分析。被数据科学家和机器学习实践者广泛使用,它涵盖分类、回归、聚类等多种算法,并且能够无缝集成到 Python 生态系统中。

3 分钟阅读
Glossary

SciPy

SciPy 是一个强大的开源 Python 库,用于科学和技术计算。在 NumPy 的基础上,它提供了高级的数学算法、优化、积分、数据处理、可视化,并与 Matplotlib 和 Pandas 等库高度兼容,使其成为科学计算和数据分析不可或缺的工具。

1 分钟阅读
Glossary

SEO 评分

SEO 评分是用来衡量网站在 SEO 最佳实践方面合规性的数值指标,评估技术层面、内容质量、用户体验及移动端响应能力。理解并提升你的 SEO 评分对于增强网站在搜索引擎结果中的可见性至关重要。

3 分钟阅读
Glossary

SpaCy

spaCy 是一个强大的开源 Python 库,专为高级自然语言处理(NLP)而设计,以其速度、效率和面向生产的特性(如分词、词性标注和命名实体识别)而闻名。

2 分钟阅读
Glossary

TensorFlow

TensorFlow 是由 Google Brain 团队开发的开源库,旨在进行数值计算和大规模机器学习。它支持深度学习、神经网络,并可在 CPU、GPU 和 TPU 上运行,简化了数据获取、模型训练和部署流程。

1 分钟阅读
Glossary

Torch

Torch 是一个基于 Lua 的开源机器学习库和科学计算框架,专为深度学习和 AI 任务优化。它提供神经网络开发工具,支持 GPU 加速,并且是 PyTorch 的前身。

2 分钟阅读
Glossary

Whisper

OpenAI Whisper 是一款先进的自动语音识别(ASR)系统,可将语音转录为文本,支持 99 种语言,对口音和噪音有强大适应性,并且作为开源项目可灵活应用于多种 AI 场景。

3 分钟阅读
Glossary

xAI 推出的 Grok

深入了解由埃隆·马斯克领导的 xAI 开发的 Grok 模型,这是一款先进的 AI 聊天机器人。了解其实时数据访问、主要特性、基准测试、应用场景,以及与其他 AI 模型的对比。

1 分钟阅读
Glossary

XGBoost

XGBoost 代表极端梯度提升(Extreme Gradient Boosting)。它是一款经过优化的分布式梯度提升库,旨在高效且可扩展地训练机器学习模型,以速度快、性能高和强大的正则化功能著称。

1 分钟阅读
Glossary

半监督学习

半监督学习(SSL)是一种机器学习技术,结合有标签和无标签数据来训练模型,非常适用于全部数据都难以或成本高昂进行标注的场景。它融合了监督学习和无监督学习的优势,提高了模型的准确性和泛化能力。

1 分钟阅读
Glossary

贝叶斯网络

贝叶斯网络(BN)是一种概率图模型,通过有向无环图(DAG)表示变量及其条件依赖关系。贝叶斯网络用于建模不确定性,支持推理和学习,广泛应用于医疗、人工智能、金融等领域。

1 分钟阅读
Glossary

边缘节点

了解 AWS 边缘节点是什么,它们与区域和可用区有何不同,以及它们如何通过降低延迟、提升性能和实现全球覆盖来增强内容分发。

1 分钟阅读
Glossary

变换器(Transformer)

变换器模型是一种专为处理序列数据(如文本、语音或时间序列数据)而设计的神经网络。与传统的循环神经网络(RNN)和卷积神经网络(CNN)不同,变换器利用注意力机制对输入序列中各元素的重要性进行加权,使其在自然语言处理、语音识别、基因组学等应用中表现出强大的性能。

1 分钟阅读
Glossary

变换器(Transformers)

变换器是一种革命性的神经网络架构,彻底改变了人工智能,尤其是在自然语言处理领域。自2017年“Attention is All You Need”提出以来,它们实现了高效的并行处理,成为BERT和GPT等模型的基础,深刻影响了NLP、视觉等多个领域。

1 分钟阅读
Glossary

标记

在大型语言模型(LLM)中,标记是由模型转换为数字表示以便高效处理的字符序列。标记是 LLM(如 GPT-3 和 ChatGPT)用于理解和生成语言的基本文本单位。

1 分钟阅读
Glossary

参数高效微调(PEFT)

参数高效微调(PEFT)是一种人工智能(AI)和自然语言处理(NLP)领域的创新方法,通过仅更新大型预训练模型中一小部分参数,使其能够适应特定任务,从而降低计算成本和训练时间,实现高效部署。

2 分钟阅读
Glossary

场景文字识别(STR)

场景文字识别(STR)是光学字符识别(OCR)的一个专门分支,利用人工智能和深度学习模型,聚焦于识别和解析自然场景图像中的文字。STR 能够将复杂的现实世界文本转换为机器可读格式,广泛应用于自动驾驶、增强现实和智慧城市基础设施等领域。

1 分钟阅读
Glossary

抽取式人工智能

抽取式人工智能是一种专注于从现有数据源中识别和检索特定信息的人工智能分支。与生成式人工智能不同,抽取式人工智能利用先进的自然语言处理(NLP)技术,在结构化或非结构化数据集中定位精确的数据片段,确保数据提取与信息检索的准确性和可靠性。

1 分钟阅读
Glossary

窗口化

在人工智能中,窗口化是指将数据按段(即“窗口”)处理,以高效分析序列信息。窗口化是 NLP 和大语言模型中的关键技术,可优化上下文处理、资源利用和模型性能,适用于翻译、聊天机器人和时间序列分析等任务。

1 分钟阅读
Glossary

垂直行业AI代理

垂直行业AI代理是专为特定行业设计的人工智能解决方案,旨在应对独特挑战并优化各领域的业务流程。了解垂直行业AI代理如何通过专业、高影响力的应用正在改变企业软件。

1 分钟阅读
Glossary

词性标注

词性标注(POS tagging)是计算语言学和自然语言处理(NLP)中的一项关键任务。它涉及根据单词的定义及其在句子中的上下文,为文本中的每个单词分配相应的词性。其主要目标是将单词归类为名词、动词、形容词、副词等语法类别,使机器能够更有效地处理和理解人类语言。

1 分钟阅读
Glossary

答案引擎优化(AEO)

了解答案引擎优化(AEO)的范围与策略,重点关注通过语音搜索、AI集成和结构化数据为用户查询提供直接答案。学习AEO与传统SEO的区别,以及它在提升用户参与度和可见性方面的作用。

1 分钟阅读
Glossary

大型语言模型(LLM)

大型语言模型(LLM)是一种通过海量文本数据训练的人工智能,能够理解、生成和处理人类语言。LLM 利用深度学习和 Transformer 神经网络,驱动文本生成、摘要、翻译等多种任务,广泛应用于各行各业。

1 分钟阅读
Glossary

递归提示

递归提示是一种用于大型语言模型(如 GPT-4)的人工智能技术,使用户能够通过反复对话迭代优化输出,从而获得更高质量和更准确的结果。

2 分钟阅读
Glossary

洞察引擎

了解什么是洞察引擎——一种先进的、由人工智能驱动的平台,通过理解上下文和意图提升数据搜索与分析能力。学习洞察引擎如何整合自然语言处理、机器学习和深度学习技术,从结构化和非结构化数据源中提取可操作的洞察。

2 分钟阅读
Glossary

对话式人工智能

对话式人工智能指的是一系列让计算机通过自然语言处理(NLP)、机器学习等语言技术来模拟人类对话的技术。它驱动着客户支持、医疗、零售等领域的聊天机器人、虚拟助手和语音助手,提高了效率和个性化体验。

2 分钟阅读
Glossary

对数损失

对数损失(Log Loss),又称对数/交叉熵损失,是评估机器学习模型性能的关键指标,尤其适用于二分类,通过衡量预测概率与实际结果之间的差异,惩罚错误或过于自信的预测。

1 分钟阅读
Glossary

多面搜索

多面搜索是一种高级技术,允许用户根据预先定义的类别(称为“面”)应用多个过滤器,从而细化和导航海量数据。该技术广泛应用于电子商务、图书馆和企业搜索,通过高效查找相关信息来提升用户体验。

2 分钟阅读
Glossary

多跳推理

多跳推理是一种人工智能过程,特别是在自然语言处理(NLP)和知识图谱中,系统通过连接多条信息来回答复杂问题或做出决策。它能够跨数据源进行逻辑连接,支持高级问答、知识图谱补全和更智能的聊天机器人。

1 分钟阅读
Glossary

发展性阅读评估(DRA)

发展性阅读评估(DRA)是一种个别施测的工具,旨在评估学生的阅读能力,提供关于阅读水平、流利度和理解力的洞察。它帮助教育工作者定制教学,并从幼儿园到八年级持续跟踪学生进步。

1 分钟阅读
Glossary

泛化误差

泛化误差衡量机器学习模型对未见数据的预测能力,通过平衡偏差和方差,确保 AI 应用的稳健性与可靠性。了解其重要性、数学定义,以及减少泛化误差的有效技术,助力真实世界的成功。

1 分钟阅读