安装
Rasa 的推荐安装方式是通过pip
:
pip install rasa-x --extra-index-url https://pypi.rasa.com/simple
这将同时安装Rasa和Rasa X。如果你不想使用Rasa X,只需要运行pip install Rasa
除非你已经安装了numpy和scipy,否则我们强烈建议你安装并使用Anaconda。
如果你想使用Rasa的开发版本,你可以从GitHub上获得:
git clone https://github.com/RasaHQ/rasa.git
cd rasa
pip install -r requirements.txt
pip install -e .
Windows系统下的环境要求
确保安装了Microsoft vc++编译器,这样python就可以编译任何依赖项。你可以从Visual Studio获得编译器。下载安装程序并在列表中选择vc++构建工具。
NLU 管道依赖项
Rasa NLU有用于识别意图和实体的不同组件,其中大多数都有一些额外的依赖项。
当你训练NLU模型时,Rasa将检查是否安装了所有必需的依赖项,并告诉你缺少哪一个依赖项。选择管道的页面将帮助你选择要使用的管道。
注意: 如果你想确保为你可能需要的任何组件安装了依赖项,并且不介意有其他依赖项存在,那么你可以使用
pip install -r alt_requirements/requirements_full.txt
安装所有依赖项。
一个很好的开始:spaCy提供的pretrained embeddings
pretrained_embeddings_spacy
管道组合了几个不同的库,是一个流行的选项。更多信息请查看spaCy文档。
你可以用以下命令安装:
pip install rasa[spacy]
python -m spacy download en_core_web_md
python -m spacy link en_core_web_md en
这将安装Rasa NLU、spacy及其英语语言模型。我们建议至少使用“中型”模型(_md
),而不是spacy默认的小型en_core_web_sm
模型。小模型运行需要更少的内存,但会在一定程度上降低意图分类(intent classification )性能。
第一选择:Tensorflow
要使用 supervised_embeddings
管道,你需要安装Tensorflow,并安装sklearn-crfsuite库来进行实体识别。要做到这一点,只需运行以下命令:
pip install rasa
第二个选择:MITIE
MITIE后端对于小型数据集执行得很好,但是如果你有数百个示例,那么训练可能会花费很长时间。我们可能会在未来弃用MITIE后端。
首先,运行:
pip install git+https://github.com/mit-nlp/MITIE.git
pip install rasa[mitie]
然后下载MITIE模型。你所需要的文件是total_word_feature_extract .dat
。可以将其保在任何地方。如果你想使用MITIE,你需要告诉它在哪里可以找到这个文件(在本例中,它保存在项目目录的data文件夹中)。
language: "en"
pipeline:
- name: "MitieNLP"
model: "data/total_word_feature_extractor.dat"
- name: "MitieTokenizer"
- name: "MitieEntityExtractor"
- name: "EntitySynonymMapper"
- name: "RegexFeaturizer"
- name: "MitieFeaturizer"
- name: "SklearnIntentClassifier"
单独使用MITIE进行训练可能非常慢,但是你可以使用这种配置:
language: "en"
pipeline:
- name: "MitieNLP"
model: "data/total_word_feature_extractor.dat"
- name: "MitieTokenizer"
- name: "MitieEntityExtractor"
- name: "EntitySynonymMapper"
- name: "RegexFeaturizer"
- name: "MitieIntentClassifier"
下一步
现在你已经安装好了所有需要的东西,准备s开始进入教程吧!