哈维尔·加西亚·德·莱尼兹,西班牙马德里的开发者
哈维尔 is 可用 租用
雇佣 哈维尔

哈维尔·加西亚·德·莱尼兹

验证专家  in 工程

自然语言处理开发人员

位置
马德里,西班牙
至今成员总数
2021年10月30日

哈维尔是一名工程师,在人工智能和数据科学领域拥有超过9年的Experience. 除了他在机器学习方面的专业知识, 自然语言处理, 软件工程, 哈维尔的独特优势在于将业务与技术相协调. 他在安永(EY)和埃森哲(埃森哲咨询公司)担任顾问的经历为他提供了宝贵的Experience, 在那里,他成功地在全球不同行业和地区实施了数据和人工智能技术.

Portfolio

自由职业者
亚马逊网络服务(AWS)、瓶、自然语言处理(NLP)、反应、SQL...
智能检索
人工智能,ChatGPT, OpenAI GPT-3 API, OpenAI GPT-4 API...
EY
Python,生成预训练变压器(GPT)...

Experience

Availability

兼职

首选的环境

Azure、Visual Studio Code (VS Code)、MacOS、Linux、Amazon Web Services (AWS)、Windows

最神奇的...

...我开发的产品是一个生成式人工智能工具,它可以构建业务数据, 文档, 电子邮件, 和录音,并处理了数百万份文件.

工作Experience

人工智能和全栈工程师

2023年至今
自由职业者
  • 开发了一个网络应用程序,允许用户根据餐馆的特点用自然语言搜索餐馆.
  • 使用AWS堆栈(如Amazon EC2)设计和部署一个简单的体系结构, Amazon RDS, Amazon S3, 弹性负载均衡(ELB), 等.
  • 设计了一个RAG流水线, 使用全文搜索快速设计查询解析模块和关键字匹配功能.
Technologies: 亚马逊网络服务(AWS)、瓶、自然语言处理(NLP)、反应、SQL, PostgreSQL, Python, OpenAI GPT-3 API, SQLAlchemy, OpenAI GPT-4 API, 信息检索, 提示工程, 认知计算, OpenAI, 自定义模型, 网页抓取, 生成预训练变压器3 (GPT-3)

首席技术官

2023年至今
智能检索
  • 领导公司的技术战略和产品开发.
  • 使用Azure DevOps CI/CD管道将平台部署到Azure.
  • 开发了检索增强生成(retrieve -augmented generation, RAG)管道,允许在业务文档(如财务报表)上使用自然语言进行搜索, 发票, 合同, 和更多的, 利用OpenAI的GPT服务.
Technologies: 人工智能,ChatGPT, OpenAI GPT-3 API, OpenAI GPT-4 API, Azure, Python, OpenAI, B2B, 自动化, 生成预训练变压器3 (GPT-3)

首席数据科学家

2016 - 2023
EY
  • 领导一个由50多名团队成员组成的多学科产品团队,构建专注于NLP和生成式AI的AI驱动产品.
  • 发达, 训练有素的, 并为不同的功能开发了多个模型, 包括布局检测, 文档分类, 命名实体识别, 以及问答和分段排序模型.
  • 开发并训练了一个深度学习模型(CNN)来清理线条, 污渍, 涂鸦, 和发票图像上的其他缺陷,以提高光学字符识别引擎的下游精度.
  • 训练了一个梯度增强分类器,以评估FATCA和CRS监管文本基线与本地实施相比变化的严重程度. 获得92分的交叉验证F1分数.5.
  • 在美国FDA报告上实现了一个主题建模LDA模型,以获得寻求制药公司投资的财富和资产管理公司的见解.
技术:Python,生成预训练变压器(GPT), 自然语言处理(NLP), 机器学习, 码头工人, 人工智能(AI), Azure, ChatGPT, OpenAI GPT-4 API, OpenAI GPT-3 API, 敏捷软件开发, Azure认知服务, OpenAI, 数据抓取, 体系结构, API集成, B2B, 自动化, 集成, 咨询

数据工程师

2014 - 2016
埃森哲咨询公司
  • 设计和开发多渠道应用(智能手机应用)的风险评估流程, 网络, 自动取款机, (西班牙国际银行的分行).
  • 开发信用卡和网上个人贷款风险评估流程的数据管道.
  • 开发SQL查询,分析风险客户数据指标.
技术:SQL、Scrum

保险理赔支付自动化

我训练和开发的NLP模型, 提取, 并从兽医发票中构造数据,以便报销动物健康保险索赔.

我开发了一个由光学字符识别组成的管道, 布局检测技术, 以及命名实体识别(NER)模型,从发票中准确提取相关信息. 我还构建了验证模块,以根据保单持有人的覆盖范围识别和验证医疗诊断.
最后, 我开发了提取置信度方法,以帮助确定自动处理或由人工审核的索赔报销, 取决于不同模型的置信度和业务规则.

按揭合同审核自动化

我训练和开发的NLP模型可以识别抵押合同中的关键数据点,从而允许对实际合同中的数据进行自动审计和验证,而不是ERP.

我训练了一个模型来区分主合同和它们的附件, 扩展, 以及使用TF-IDF特征来训练分类器的修改. 我还开发了验证模块来消除歧义并匹配契约和DB行,并执行比较以突出差异.

税务宽免申请资格

我建立和训练的NLP模型可以从各种文档(如发票)中提取关键数据点, 抵押贷款, 薪水, 和更多的.

这是为了提高申请新冠肺炎相关的政府税收减免项目的效率,该项目收到了数以百万计的申请.

我开发了一个由手写文本检测组成的管道, 布局检测技术, 分类(检测文档类型), 以及NER(命名实体识别)模型,从文档中准确提取相关信息. 我还开发了信心模块,该模块根据业务规则和模型的信心对应用程序的人工审查进行优先级排序.

发票验证自动化

我开发了一个人工智能驱动的系统,用于自动分析施工过程中的财务文件, 针对大量的发票, 采购订单, 货物收到票据. 该项目旨在检测不匹配和不一致,以防止经济损失.

该项目的管道从光学字符识别技术开始,从扫描文档中准确提取文本. 我使用命名实体识别(NER)模型来识别和分类这些文本中的关键数据点, 例如供应商名称, 日期, 和数量. 该项目的一个重要部分是开发分类模型,以准确地检测和分类不同的文档类型, 自动检测其相关数据点.

另外, 我实现了模糊匹配算法,将发票中列出的项目与采购订单中的相应条目链接起来. 这种方法是识别不匹配和不一致的关键.
2018年12月至今

自然语言处理纳米级

Udacity

2017年12月至今

机器学习工程师纳米学位

Udacity

库/ api

SpaCy, Scikit-learn, 熊猫, Azure认知服务,Keras, 反应, SQLAlchemy

工具

命名实体识别(NER)

语言

Python、SQL

范例

自动化,Scrum,敏捷软件开发,B2B

存储

PostgreSQL

平台

码头工人、Azure、Visual Studio Code (VS Code)、MacOS、Linux、Amazon Web Services (AWS)、Windows

框架

其他

自然语言处理(NLP), GPT, 生成预训练变压器(GPT), 人工智能(AI), 机器学习, 深度学习, OpenAI GPT-4 API, OpenAI GPT-3 API, OpenAI, 数据抓取, 计算机视觉, 光学字符识别, 手写识别, 文本分类, Tf-idf, 信息检索, 提示工程, 认知计算, 自定义模型, 网页抓取, 体系结构, API集成, 集成, 咨询, 生成预训练变压器3 (GPT-3)

有效的合作

如何使用Toptal

在数小时内,而不是数周或数月,我们的网络将为您直接匹配全球行业专家.

1

分享你的需求

在与Toptal领域专家的电话中讨论您的需求并细化您的范围.
2

选择你的才能

在24小时内获得专业匹配人才的简短列表,以进行审查,面试和选择.
3

开始你的无风险人才试验

与你选择的人才一起工作,试用最多两周. 只有当你决定雇佣他们时才付钱.

对顶尖人才的需求很大.

开始招聘