Python3中的LRU缓存机制 缓存是一种将定量数据加以保存以备迎合后续获取需求的处理方式,旨在加快数据获取的速度。数据的生成过程可能需要经过计算,规整,远程获取等操作,如果是同一份数据需要多次使用,每次都重新生成会大大浪费时间。所以,如果将计算或者远程请求等操作获得的数据缓存下来,会加快后续的数据获取需求。 本文接下来会介绍Python3中的 functools.lru_cache 缓存机制以及对应的使用方法! 2020-12-15 #Python #缓存 #Cache
Rasa NLU 详解 目录 【关于 rasa->NLU 】那些你不知道的事 目录 一、概况图 二、动机 三、什么是 自然语言理解? 四、自然语言理解 的 工作 是什么? 五、自然语言理解 三层次,你知道么? 六、自然语言理解 一般理解 你知道么? 七、NLU 训练数据如何准备? 7.1 NLU 训练样本数据格式? 7.2 NLU 训练样本数据格式如何验证? 八、Rasa NLU Components 8.1 2020-12-14 #Rasa NLU
Rasa安装以及项目初尝试 Rasa简介 Rasa安装 Windows系统下的环境要求 NLU 管道依赖项 首选spaCy 第二个选择:MITIE Rasa教程 1.创建新的项目 2.构建NLU样本 3.构建Core样本 4.定义域 5.定义你的模型配置 6.训练NLU和CORE模型 7.配置Http和Action 8.和你的助手谈谈 9.启动web服务 Rasa命令备忘单 Rasa架构 2020-12-14 #Rasa #聊天机器人
A/B 测试(A/B test) A/B 测试(A/B test) 什么是A/B测试 A/B测试的本质 A/B测试的两种做法 A/B测试的步骤 基于hash的AB测试 其他常见问题 2020-12-09 #AB Test #AB测试
经典算法重温 Aho-Corasick automaton(转载) 参考:https://carlos9310.github.io/2020/01/01/Aho-Corasick/ Aho–Corasick automaton 算法(简称AC自动机算法)是由Alfred V. Aho和Margaret J.Corasick于1975年在贝尔实验室发明的多模(模式串)匹配算法。即给定多个模式串和一个文本串,求解多模串在文本串中存在的情况(包括是否存在、存在几次、存在 2020-12-01 #Aho-Corasick #AC自动机
超参数优化框架Optuna 超参数优化框架Optuna本文介绍超参数优化框架Optuna,Optuna是一种自动超参优化框架,专为机器学习而设计。它具有命令式,按运行定义的用户API。使用Optuna编写的代码具有很高的模块性,Optuna的用户可以动态构建超参数的搜索空间。 它目前支持的部分库有(全部请参见官网): XGBoost LightGBM Sklearn Keras TensorFlow tf.keras MX 2020-11-13 #教程 #Optuna #超参数优化
✨工程实践指导原则 ✨工程实践方法论 一个优秀的机器学习实践者需要知道: 存在哪些算法以及这些算法为何有效的原理 如何针对具体应用挑选一个合适的算法 如何监控算法,并根据实验反馈改进机器学习系统 实际开发过程中,实践者需要决定:是否收集更多的数据、是否需要增加/降低模型容量、是否需要添加/删除正则化项、是否需要改进模型的优化算法、是否需要改进模型的近似推断….这些都需要大量的时间 在实际应用中,正确使用一个普通算 2020-10-22 #项目管理 #工程实践
HuggingFace-Transformers手册 HuggingFace-Transformers手册Transformers(以前称为pytorch Transformers和pytorch pretrained bert)为自然语言理解(NLU)和自然语言生成(NLG)提供了最先进的通用架构(bert、GPT-2、RoBERTa、XLM、DistilBert、XLNet、CTRL…),其中有超过32个100多种语言的预训练模型并同时支持Ten 2020-10-13 #教程 #技术