URL2io API 包含 URL2Article 和 URL2NLP 两个服务,实现网页结构智能解析和文本信息智能处理。 当前文档包含所有可用的 API 及使用方法(详细文档)。 API使用 token
Python 2.7 and 3.4+
pip install url2io-client
If the python package is hosted on Github, you can install directly from Github
pip install git+https://github.com/url2io/url2io-python-client.git
(you may need to run pip
with root permission: sudo pip install git+https://github.com/url2io/url2io-python-client.git
Then import the package:
import url2io_client
Install via Setuptools.
python setup.py install --user
(or sudo python setup.py install
to install the package for all users)
Then import the package:
import url2io_client
Please follow the installation procedure and then run the following:
from __future__ import print_function
import time
import url2io_client
from url2io_client.rest import ApiException
from pprint import pprint
# Configure API key authorization: token_in_query
configuration = url2io_client.Configuration()
configuration.host = 'YOUR_API_SERVICE_URL' # 你申请的服务地址,默认为体验版地址:http://url2api.applinzi.com
configuration.api_key['token'] = 'YOUR_API_KEY'
# Uncomment below to setup prefix (e.g. Bearer) for API key, if needed
# configuration.api_key_prefix['token'] = 'Bearer'
# create an instance of the API class
api_instance = url2io_client.URL2ArticleApi(url2io_client.ApiClient(configuration))
url = 'url_example' # str | 要提取正文网页的网址,参考 [URL Encoding](http://www.w3schools.com/tags/ref_urlencode.asp)
fields = ['fields_example'] # list[str] | 指示需要额外返回的额外字段,取值为: - `next`: 表示要提取下一页链接。 - `text`: 表示要返回正文的纯文字格式。 - `markdown`: 表示返回正文的markdown格式。 构造url时多个值通过','号隔开,如`?fields=text,next`。调用sdk时使用列表即可,如fields= ['text', 'markdown']。 (optional)
param_callback = 'param_callback_example' # str | 使用jsonp实现Ajax跨域请求时需要传此参数 (optional)
# 网页结构智能解析 HTTP Get 接口
api_response = api_instance.get_article(url, fields=fields, param_callback=param_callback)
except ApiException as e:
print("Exception when calling URL2ArticleApi->get_article: %s\n" % e)
Class | Method | HTTP request | Description |
URL2ArticleApi | get_article | GET /article | 网页结构智能解析 HTTP Get 接口 |
URL2ArticleApi | get_article_by_post | POST /article | 网页结构智能解析 HTTP Post 接口 |
URL2NLPApi | get_keywords | POST /v1/nlp/keywords | 关键词提取接口 |
URL2NLPApi | get_word_cut | POST /v1/nlp/word/cut | 中文分词和词性注解接口 |
