Skip to Content
AI🚀 基础概念

什么是 AI

AI 即人工智能( Artificial Intelligence),是一种能够模拟人类智能行为的计算机系统。

其核心功能包括:机器学习、计算机视觉、自然语言处理、文档智能、知识挖掘、生成式 AI 等。

机器学习

机器学习是人工智能的一个重要分支,它通过算法和统计模型让计算机系统能够从数据中学习并改进。主要特点包括:

  • 数据驱动:通过大量数据训练来发现规律和模式
  • 自动优化:系统能够根据反馈自动调整和优化性能
  • 预测能力:基于历史数据对未来情况进行预测
  • 持续学习:随着新数据的加入不断改进和提升

常见的应用包括图像识别、自然语言处理、推荐系统等。

计算机视觉

大多数计算机视觉解决方案都基于机器学习模型,这些模型使计算机能够从图像或视频中获取信息并理解其内容。主要包括以下核心功能:

  • 图像分类:识别图像中的主要对象或场景类别
  • 对象检测:定位并识别图像中的多个对象
  • 语义分割:对图像中的每个像素进行分类
  • 图像分析:提取图像特征并生成描述性标签
  • 人脸识别:检测和分析人脸特征
  • 文字识别(OCR):从图像中提取文字信息

这些技术广泛应用于安防监控、自动驾驶、医疗影像等领域。

自然语言处理

自然语言处理(NLP)是人工智能的一个重要分支,它使计算机能够理解和处理人类语言。主要包括以下核心功能:

  • 文本分类:将文本分为不同的类别
  • 情感分析:分析文本的情感倾向
  • 机器翻译:将一种语言翻译成另一种语言
  • 文本生成:根据给定的文本生成新的文本
  • 文本摘要:从长文本中提取重要的信息
  • 命名实体识别:识别文本中的实体
  • 问答系统:回答用户的问题
  • 对话系统:与用户进行自然的对话

文档智能

文档智能是一种利用人工智能技术来智能处理和管理各类文档的解决方案。它能够自动识别、提取和处理文档中的信息,实现文档的智能化管理。主要功能包括:

  • 智能识别:自动识别文档类型和内容
  • 信息提取:从文档中提取关键信息
  • 格式转换:支持多种文档格式的互相转换
  • 智能分类:自动对文档进行分类和归档
  • 内容检索:快速定位和检索文档内容
  • 安全控制:确保文档访问和使用的安全性
  • 协作共享:支持多人协作和文档共享
  • 版本管理:追踪文档的修改历史
  • 智能分析:对文档内容进行深度分析
  • 合规检查:确保文档处理符合规范要求

知识挖掘

知识挖掘是指从海量数据中提取有价值信息和知识的过程。它通过分析非结构化数据(如文本、图像、音频等),发现数据中的模式、规律和关联,并将其转化为可用的知识。

主要应用包括:

  • 知识图谱构建:将分散的知识点连接成网络
  • 智能问答:基于知识库回答用户问题
  • 知识推理:通过已有知识推导新知识
  • 知识发现:从数据中发现新的规律和见解
  • 知识管理:对知识进行分类、存储和检索

生成式 AI

生成式 AI 是一种能够创作原创内容的 AI 系统,包括文本、图像、代码等多种形式。主要包括以下核心功能:

  • 文本生成:根据给定的文本生成新的文本
  • 图像生成:根据给定的描述生成新的图像
  • 代码生成:根据给定的描述生成新的代码
  • 对话生成:与用户进行自然的对话
  • 内容创作:生成各种类型的内容
  • 内容增强:增强已有内容的质量
  • 内容优化:优化已有内容的质量

常见术语

  • 大语言模型 (LLM):基于深度学习的大型神经网络模型,能够理解和生成自然语言文本
  • Token:AI 模型处理文本时的基本单位,可以是单词、字符或子词
  • API (应用程序编程接口):使软件组件之间能够通信的接口,确保系统各部分能够独立更新而互不影响
  • API 密钥:用于验证和授权访问 AI 服务的凭证
  • 训练:使用数据来优化模型参数的过程
  • 推理:使用训练好的模型进行预测或生成的过程
  • 模型微调:在预训练模型基础上进行特定任务的优化训练
  • 提示工程 (Prompt Engineering):设计和优化输入提示以获得更好的 AI 输出结果
  • Embedding:将文本、图像等数据转换为向量表示的技术
  • 向量数据库:存储和检索向量数据的数据库系统
  • 神经网络:模仿人脑结构的计算模型,由相互连接的神经元组成
  • 机器学习 (ML):让计算机系统通过数据学习并改进性能的技术,无需显式编程
  • 深度学习 (DL):机器学习的一个分支,使用多层神经网络进行复杂模式识别
  • 自然语言处理 (NLP):使计算机能够理解、解释和生成人类语言的技术
  • 计算机视觉 (CV):让计算机能够”看见”并理解图像和视频的技术
  • 强化学习 (RL):通过与环境交互来学习最优策略的机器学习方法
  • 迁移学习:将已学习的知识应用到新任务中的技术
  • RAG (检索增强生成):结合检索系统和生成模型的混合架构(常用于增强搜索引擎的语义理解能力)
Last updated on