技术方向
  • 深度问答

    深度问答依托海量互联网数据资源,对用户需求进行深度语义解析,进而将答案直接定位并精准抽取、提炼出来呈现给用户,提升用户获取信息的效率。百度NLP在深度问答方向经过多年打磨,积累了问句理解、答案抽取、观点分析与聚合等方面的一整套技术方案,目前已在搜索、度秘等多个重量级产品中深度应用,为亿万用户提供高质量问答服务。

  • 篇章理解

    篇章理解以篇章级文本为处理对象,通过篇章结构分析、主题分析、内容标签、情感分析、自动摘要等关键技术实现对文本内容的理解。目前,篇章理解的关键技术已经在搜索、资讯流、糯米、度秘等产品得到广泛使用。

  • 智能写作

    利用百度海量数据资源优势,自动发现用户感兴趣的话题,基于内容理解和自然语言生成技术快速生成满足用户需求的文章。智能写作可通过结构化数据和内容聚合的方式生成新闻快讯、话题盘点和知识聚合等文章,已涵盖电影、美食、旅游、体育、财经等多个领域和话题。目前,智能写作已经在百家号和百度资讯流产品中广泛应用。

  • 对话系统

    需求理解和对话控制是对话系统的核心。百度的需求理解技术从搜索引擎时代就开始积累和发展,而对话控制技术目前在垂直领域和通用领域都有很深的技术积累和应用验证,应用包括搜索、度秘等。在此基础上发展出了可自行定制和训练的理解与交互技术平台(UNIT),帮助更多应用方快速创建自己的对话系统;在通用领域的对话技术上也在持续探索和深耕。

  • 机器翻译

    百度翻译目前支持全球28种语言,覆盖756个翻译方向,日均响应上亿次翻译请求。拥有网页版、手机APP和开放API等产品形态,支持文本、语音、图像等翻译功能;并提供精准人工翻译服务,满足不同场景下的翻译需求。百度翻译在多项翻译技术取得重大突破,发布了世界首个神经网络翻译(NMT)线上系统,并获得2015年度国家科技进步奖。

  • 语义计算

    将以深度学习和概率图模型为代表的机器学习技术和文本任务深度融合,充分利用互联网大数据对语义表示计算的指引作用,研发了包含语义向量表示、语义匹配度计算、篇章主题分析在内的多项领先技术。语义计算系列技术可覆盖长短文本不同场景,已在搜索、推荐、广告等一系列应用中发挥重要作用。

  • 语言分析

    语言分析方向致力于研究分词、词性标注、专名识别、词重要性、词紧密度、词义消歧、实体消歧、句法分析以及语义分析等面向中文文本的基础分析技术。依托于百度的大数据积累和深度学习技术、语言分析不断打磨、优化分析能力,支持了百度众多产品,目前部分核心分析服务已对第三方开发者开放。

  • 知识挖掘

    知识挖掘方向致力于通过深入分析互联网数据和用户行为,建设可计算的NLP知识资源(如新词、词关系、实体属性值等),并在此基础上梳理、构筑实用化的知识体系(如新词&词性体系、实体&概念类别体系、词汇关系体系、实体知识图谱等)。通过多年持续的积累与优化,知识挖掘方向成功支持了百度内部众多产品,并抽象积累了很多可灵活组装、快速响应应用需求的挖掘技术。

  • 个性化

    个性化解决方案以提升业务的核心指标为目标,赋能产品使之具有千人千面的贴心体验。技术上通过多源实时用户日志融合、用户行为分析与特征建模、个性化情景化算法等一整套框架,并以推荐、排序、生成等应用方式,大幅度提升产品的用户体验。在搜索、手机百度、Feed、糯米等重要产品均有深入的合作与落地。

  • 反馈学习

    反馈学习是根据环境给出反馈信号,动态学习和优化系统,以契合环境达到整体目标优化的学习技术。百度NLP深入研究了包括强化学习(Reinforcement Learning)、MAB(Multi-armed Bandits)及其他有监督学习算法在内的一系列反馈学习技术,并针对搜索、推荐、广告等工业级场景不断探索,积累了丰富的实践经验,取得了显著的应用成果。

学术成果
发表年份
搜索到与“”相关文献 对结果不满意?去“百度学术”搜索