-
Notifications
You must be signed in to change notification settings - Fork 4
/
eda.py
40 lines (35 loc) · 20 KB
/
eda.py
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
import json
from ChineseTextEDA.eda import EDA
sentences = [{"id": "3d5a5fe91717dfd7b874c5d570c41f02", "title": "一种票据处理装置、方法及自助金融设备、终端设备", "assignee": "深圳市怡化时代科技有限公司", "abstract": "本发明适用于金融交易技术领域,提供了一种票据处理装置、方法及自助金融设备、终端设备,包括存票口、分票模块、鉴别模块、换向器、票箱、退票槽、票据通道以及票据信息检测模块,票据信息检测模块用于检测票据位于所述票据处理装置的位置信息,并反馈所述位置信息以使所述票据处理装置根据所述位置信息对票据进行处理,通过票据信息检测模块检测票据位于票据处理装置的位置信息,然后反馈票据所处的具体位置信息控制票据处理装置对票据进行相关的处理,能够灵敏地、全面系统地处理票据处理装置中的票据,有效地解决现有的票据处理装置存在灵敏度低和无法系统地处理票据业务的问题。", "label_id": 32},
{"id": "48b68c3d347ef3a992e9d9e286168a8d", "title": "一种基于生产模式的撮合匹配方法和装置", "assignee": "北京京东金融科技控股有限公司", "abstract": "本发明公开了一种基于生产模式的撮合匹配方法和装置,涉及计算机技术领域。该方法的一具体实施方式包括:根据借款单的借款金额、投资单的投资金额以及分组金额阈值,分别对借款单以及投资单进行分组,得到借款单集合以及投资单集合;分析借款单集合的借款总额以及投资单集合的投资总额之差,确定差值在预定差值范围内的借款单集合和投资单集合的匹配关系;在所确定的匹配关系中,遍历借款单集合中各借款单与投资单集合中各投资单的差值,确定差值最小的投资单与相应的借款单匹配。该实施方式提出一种新的生产线处理模式,采用生产者消费者模式进行数据计算,取代传统的线程池模式,达到借款单以及投资单的完美高效匹配,保证交易的顺利执行。", "label_id": 32},
{"id": "f944ef6c47b8bdc6e67aee8b172d4831", "title": "一种飞行器服务系统及通行方法", "assignee": "广州煜煊信息科技有限公司", "abstract": "本发明涉及一种飞行器服务系统及通行方法。系统包括飞行器上的导航规划系统及空中区域的管理终端,飞行器上的导航规划系统与空中区域的管理终端交互,所述的管理终端为多个,分别划分管理不同的区域,一个管理区域配对设置一个管理终端,以电子围栏作为边界,该管理终端对该空中区域的通行进行管理和对外通信,并对通行的信息进行记录和保存。基于本发明的系统,飞行器可以实时更新规划飞行路线,实现去中心化空中航线规划和通行。", "label_id": 32},
{"id": "41f72dff5620a81b1f6f5996c608cd1b", "title": "保险信息处理方法、装置和系统", "assignee": "平安科技(深圳)有限公司", "abstract": "本发明涉及一种保险信息处理方法,所述方法包括以下步骤:业务员终端获取用户信息;获取待办理险种的协议模板文件,所述协议模板文件包括前期协议模板文件;根据所述用户信息与所述前期协议模板文件生成与用户信息对应的第一格式的第一保险协议文件,所述第一保险协议文件中包含对应的用于唯一标识所述第一保险协议文件的第一标识码;将每个第一格式的第一保险协议文件转化为对应的第二格式的第一保险协议文件;将所述第二格式的第一保险协议文件上传到服务器。该方法与传统的采用纸质的第一保险协议文件来进行保存相比,提高了保险信息处理的效率。此外,还对应提供了一种保险信息处理装置与一种保险信息处理系统。", "label_id": 32},
{"id": "afa1b27d0e814d6bbd50761b7d0ff25c", "title": "一种沥青混合料水稳定性评价方法", "assignee": "山西晋北高速公路养护有限公司", "abstract": "本发明公开了一种沥青混合料水稳定性评价方法,设置成型两组棱柱形混合料试件,一组试件在‑20℃~60℃的环境中超声震荡循环,以快速模拟荷载作用下混合料内部水、颗粒物等对沥青的乳化、冲刷和低温下冰的冻胀作用。而后对两组试件分别进行强度测试,首先模拟了荷载作用下集料间的挤压和剥离过程,实现混合料内部的结构松散,松散程度用S表示,而后施加破坏压力F表征混合料内部抵抗外部荷载的能力,最终以两组试件的F/S表征混合料水稳定性的优劣。本发明评价方法能够加速模拟荷载、水分、颗粒物、温度等因素耦合作用下对沥青路面的破坏进程,提高试验效率;评价方法耦合了外部破坏荷载和内部松散程度对混合料水稳定性能的影响,结果更科学。", "label_id": 22},
{"id": "944971b77d62e41f4d9be974d2459002", "title": "一种测定醇胺溶液中N,N-二羟乙基甘氨酸含量的方法", "assignee": "中国石油天然气股份有限公司", "abstract": "本发明公开了一种醇胺溶液中N,N‑二羟乙基甘氨酸含量的测定方法,属于化学检测领域。该方法包括:向装填有阳离子交换树脂的离子交换树脂柱中加入预定量的醇胺溶液样品,所述醇胺溶液样品流经所述阳离子交换树脂,醇胺吸附在所述阳离子交换树脂上,而N,N‑二羟乙基甘氨酸随流出液由所述离子交换树脂柱的出口排出;测定所述流出液中所述N,N‑二羟乙基甘氨酸质量分数,进而获得所述醇胺溶液中所述N,N‑二羟乙基甘氨酸的含量。该方法能准确测量醇胺溶液中N,N‑二羟乙基甘氨酸的含量。", "label_id": 22},
{"id": "59211c0eb1072bd2962540326f593fc4", "title": "可实现高通量组分筛选的模具及成型方法", "assignee": "上海大学", "abstract": "本申请公开了一种可实现高通量组分筛选的模具及成型方法,涉及材料筛选。模具包括装料模腔、多个横向隔片、底座和压头。装料模腔具有空腔,用于盛装原料及安装其他零件。多个横向隔片中每一横向隔片用于沿空腔的横向安装并与其可拆卸连接,以将空腔分成若干相等或者不等的间隔,每一间隔用于盛装不同组分不同比例的原料,以同时进行两种或者两种以上的组分优选。底座用于安装在装料模腔的底部。压头用于由装料模腔的上端至下端压入,以将原料压制成压片。在实验配料制备过程中,利用本申请可使得两种或两种以上的原料可以直接在模具中实现组分连续变化的梯度混合,可以对该模具中混合好的原料进行一次性同时压片,大大提高了工作效率。", "label_id": 22},
{"id": "fefd0b01aa829c709a372fbbdedb14e1", "title": "一种橡胶磨耗试验设备", "assignee": "深圳天溯计量检测股份有限公司", "abstract": "本发明公开了一种橡胶磨耗试验设备,包括底板,底板的上表面固定安装有平板,平板上活动安装有支撑座,电机安装板与转动轴固定连接,电机安装板的顶部固定有减速电机,砂轮轴的一端固定安装有砂轮,底板上竖直设置有两个支撑柱,两个支撑柱的顶部之间设置有支撑横杆,支撑横杆的一侧活动安装有两个移动杆,两个移动杆的端部之间安装有橡胶安装辊,橡胶安装辊上安装有橡胶环,支撑横杆的一侧安装有配重槽,移动安装板的一侧设固定安装有抽风机;该橡胶磨耗试验设备测试多样化,效果好,避免橡胶环磨损导致配重块施加压力不一致,从而提高了试验结果的精确,可以快速对橡胶环进行安装和拆卸,工作效率高。", "label_id": 22},
{"id": "7daf27b332dddc2805fb110be744ec5d", "title": "一种混凝土管片抗折性能试验台", "assignee": "亚泰集团沈阳现代建筑工业有限公司", "abstract": "本发明公开了一种混凝土管片抗折性能试验台,包括机架,所述机架长轴的两端通过螺丝固定安装有第一支撑杆,第一支撑杆为L型,第一支撑杆水平部分嵌入安装有水平液压杆,且水平液压杆的伸缩端通过螺丝连接有下加力支座,所述机架短轴的两端通过螺丝固定安装有第二支撑杆,第二支撑杆的上端连接有支撑架,且支撑架的上端通过螺丝安装有竖直液压杆,竖直液压杆的伸缩端通过螺丝连接有上加力支座,本装置使用时,先将混凝土管片放置在两个下加力支座上,再加支撑架套接到第二支撑杆的上端,并固定好插销,即可用进行测试,测试时可以利用水平液压杆和竖直液压杆分别或者同时对混凝土管片进行试验,试验过程方便简单。", "label_id": 22},
{"id": "d2d5f5d71f8497c6b5df0c93e83a5767", "title": "一种高空抛物监测方法", "assignee": "湖南联智科技股份有限公司", "abstract": "本发明提供了一种高空抛物监测方法。包括根据建筑物尺寸在建筑物顶部架设摄像头,对建筑物侧面抛物情况进行监控,并将录像文件发送至控制中心;控制中心通过相邻的图片帧对比来判断是否有抛物情况出现,再找到第一次出现抛物目标的图片帧的时间戳并找到所有摄像头在这一时刻拍摄的图像进行二值化处理,得到每个摄像头对应的二值化图像;沿建筑物监控面建立与房号对应的直角坐标系,确定每个摄像头对应的坐标及抛物点和摄像头之间的几何关系,结合二值化图像计算抛物点对应的抛物坐标,再得出抛物坐标对应的房号。本发明通过沿建筑物的监测侧面建立直角坐标系,可根据计算得出的抛物坐标快速定位抛物的房号,便于进行高空抛物追踪、教育和追责。", "label_id": 12},
{"id": "924a0a834fbde91baf5a7a5f635a78b5", "title": "图像传感器", "assignee": "意法半导体(克洛尔2)公司", "abstract": "本公开涉及图像传感器,该传感器包括像素(1),每个像素包括:第一晶体管(118)和第一开关(120),该第一晶体管和该第一开关串联在像素的第一节点(124)与内部节点(122)之间,第一晶体管(118)的栅极耦合到第二节点(106);电容性元件(110),其第一端子连接至第二节点;以及多个组件(A、B),每个组件包括与耦合到内部节点的第二开关(130)串联的电容(128),传感器包括电路(150),该电路被配置为每次在组件(A、B)之一中存储电压时,通过以下方式来控制第一节点(124)与内部节点(122)之间的电流的中断:切换施加到电容性元件的第二端子(112)的第一电位(Vech);或者断开第一开关(120)。", "label_id": 12},
{"id": "da12c779739d2bfe22d072172d8586b5", "title": "一种基于三维模型数据的3D打印装置", "assignee": "南通理工学院", "abstract": "本发明公开了一种基于三维模型数据的3D打印装置,包括底板,所述底板的上方由上至下依次设有挤出机构、纵向移动机构、上下移动机构、旋转机构和横向移动机构;该基于三维模型数据的3D打印装置,通过控制第一气缸带动板材左右移动,通过控制电机带动板材旋转,通过控制第二气缸的活塞杆的伸缩带动纵向移动机构和板材上下移动,通过控制第三气缸带动板材前后移动,通过控制板材不同方位的移动,使得液体原料在板材不同方位的堆积、凝固,完成不同形状的产品的打印,同时方便打印圆管形产品,同时提高了管形产品的圆润度,提高了美观性,提高了制作产品的质量,提高了润滑效果,提高了该装置的使用寿命。", "label_id": 12},
{"id": "e47c1d9b43fea332cdfe54cc1f06652d", "title": "一种调节屏幕显示亮度的方法、移动终端及计算机可读存储介质", "assignee": "努比亚技术有限公司", "abstract": "本发明公开了一种移动终端,其包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的调节屏幕显示亮度的方法,通过获取与所述移动终端近距离连接的可穿戴设备,判断所述移动终端是否处于锁屏状态,若所述移动终端处于锁屏状态,实时采集所述可穿戴设备检测到的第一环境光强数据,识别解锁指令,按照与所述第一环境光强数据匹配的第一屏幕亮度值点亮所述移动终端的屏幕;该方法主要是基于当前用户同时拥有移动终端和可穿戴设备的基础上实现的,解决了现有移动终端解锁后屏幕亮度调节延时的问题,达到了提升用户体验,提高移动终端使用的便利性,给用户更好的交互体验的效果。", "label_id": 12},
{"id": "cd9c22f06b649f555bb5a4bbc928e8ae", "title": "3D眼镜及相关系统", "assignee": "杜比实验室特许公司", "abstract": "本发明公开了3D眼镜及相关系统。具有RFID标签(嵌入在一个或多个镜腿中)的3D眼镜被租赁给剧院或其他场所运营商。眼镜可在托盘中装运到场所,分发给顾客并从顾客处收集。当眼镜在托盘中时(例如在运送到剧院时,从剧院收集时,在3D租赁公司检查时等),通过RFID扫描实施盘存和其他测量。从RFID扫描和检查收集的数据允许租赁公司基于损耗适当地向各场所分摊租赁成本,损耗包括例如可归因于并可追踪到特定场所的异常磨损、破坏、或盗窃。剧院或场所也可以在运送和获取时独立扫描托盘以维持其自己的记录。本发明包括具有RFID的3D眼镜、清洗支架和租赁系统。", "label_id": 12},
{"id": "fdb0a39c48742eb386234ed5c8c5d23c", "title": "全向立体视觉的摄像机配置系统", "assignee": "南京深视光点科技有限公司", "abstract": "本实用新型提供了一种全向立体视觉的摄像机配置系统,摄像机配置系统主要包括:至少四个主摄像镜头,分别排列于可构成一矩形的四基准线;至少四个副摄像镜头,各主摄像镜头与各副摄像镜头,可沿着四个基准线于同一平面间隔排列设置为矩形;本申请的关键在于,各副摄像镜头或各主摄像镜头的光轴,被配置为可分为两部分旋转,使排列于同一基准线的摄像镜头的光轴彼此平行,以及使排列于同一基准线的摄像镜头的光轴皆与基准线垂直,以完成摄像机校正;因此,可让对应于各基准线的至少二深度图于执行影像融合演算后,消除遮挡区域,进而能通过影像拼接获取无遮挡的全向深度图。", "label_id": 12},
{"id": "6af8c4c55c93ee38b8912db4576b3cfc", "title": "一种信息处理方法及装置", "assignee": "腾讯科技(深圳)有限公司", "abstract": "本发明公开了一种信息处理方法,所述方法包括:第一进程获取来自多个查询请求端的多个数据请求,所述多个包括两个及两个以上;所述第一进程将所述多个数据请求分发给多个第二进程;所述第二进程将所述数据请求排入统计队列;第三进程从所述统计队列中获取数据请求;所述第三进程获取预设的第一策略,根据所述第一策略从所述数据请求中提取统计参数;所述第三进程从存储设备上获取第一统计信息,根据所述统计参数更新所述第一统计信息;所述第三进程将更新后的第一统计信息写入所述存储设备。本发明同时还公开了一种信息处理装置。", "label_id": 35},
{"id": "bc94427b0ae4c5a734ef7d32d6a1b9ea", "title": "一种适用于安防的广告机", "assignee": "靖江天元爱尔瑞电子科技有限公司", "abstract": "本实用新型公开了一种适用于安防的广告机,包括支撑架,支撑架的上端设置有显示屏,显示屏与壳体配合连接,壳体内部设置有安卓主板;特点是安卓主板一侧设置有与电源板相连接的电源端子,电源板同时为安卓主板与4G板供电;还设置有与4G板相连接的4G板端子,4G板上连接有天线;另一侧设置有与显示屏相连接的双八LVDS端子及背光端子;与左声道喇叭、右声道喇叭相连接的喇叭端子;与USB接口板相连接的系统升级端子;与摄像头相连接的摄像头端子。本实用新型结构简单,使用方便,安全可靠,隐蔽性好,将人脸记录实时传输至客户服务器,为安防工作提供了很大的便利性,隐蔽性好,广泛适用于车站、酒店大厅等多种场合。", "label_id": 35},
{"id": "2b1d9b24b86b2e49f842bd2c93cb865c", "title": "一种广告投放控制方法及装置", "assignee": "阿里巴巴(中国)有限公司", "abstract": "本发明公开了一种广告投放控制方法及装置,以解决现有技术中基于地域定向的广告投放方式准确度较低的问题,该方法包括:接收广告投放请求,广告投放请求中携带有IP地址;查找预先设置的与IP地址对应的地理位置信息,该地理位置信息中包括IP地址中包含的最小行政区域单位;获取该地理位置信息对应的广告投放数据;根据广告投放数据确定是否允许广告投放请求的广告进行投放,该方案可以使得广告的投放更加准确,减少广告投放不准确导致的广告效果不理想的情况。", "label_id": 35},
{"id": "674baad2739c09bc9cc759322a0085c7", "title": "一种广告数据推荐方法和系统", "assignee": "北京奇艺世纪科技有限公司", "abstract": "本发明公开了一种广告数据推荐方法和系统。所述方法包括:接收到用户对目标广告数据的浏览请求后,获取所述用户的用户特征信息,将所述用户特征信息输入预先建立的相关度预测模型,得到所述目标广告数据的各广告展现形式与所述浏览请求的相关度,将包含相关度满足预设条件的广告展现形式的目标广告数据推荐给所述用户,由于本发明实施例是根据用户的用户特征信息确定广告展现形式,进而确定推荐的广告数据,因此提高了用户对展示的广告数据的兴趣,提高了用户体验,减少了广告数据点击率低的无效曝光。", "label_id": 35},
{"id": "94b8d5a69a04bc931bb2d65ea95fc9b2", "title": "一种基于大数据的广告推送系统", "assignee": "浙江华坤道威数据科技有限公司", "abstract": "本发明公开了一种基于大数据的广告推送系统,包括用户信息采集模块、大数据采集模块、数据处理模块、数据分析模块、模型构建模块、用户评级模块、总控模块、广告推送模块;其中,所述用户信息采集模块用于采集单个客户数据,所述单个客户数据包括单个客户浏览页面的内容信息、单个客户的注册账号时预留的手机号信息、单个客户的指定页面搜索商品记录、购买记录、购买金额与点击广告的次数;所述大数据采集模块用于采集大众数据,所述大众数据包括所有用户的指定页面搜索商品记录、购买记录、购买金额与点击广告次数;本发明能够采集更多的数据,让使用者能够更加直观的了解自己的客户群体,同时能够实现更少的投放更大的收益。", "label_id": 35}]
eda = EDA(num_aug=20)
enhance_result = []
for sentence in sentences:
aug_abstracts = eda.eda(sentence["abstract"], alpha_sr=0.15, alpha_ri=0.15, alpha_rs=0.15, p_rd=0.15)
aug_titles = eda.eda(sentence["title"], alpha_sr=0.15, alpha_ri=0.15, alpha_rs=0.15, p_rd=0.15)
for aug_abstract, aug_title in zip(aug_abstracts,aug_titles ):
enhance_result.append({"id": sentence["id"], "title": aug_title.replace(" ",""), "assignee": sentence["assignee"], "abstract": aug_abstract.replace(" ",""), "label_id": sentence["label_id"]})
# jsonArr = json.dumps(enhance_result, ensure_ascii=False)
print(enhance_result)
with open('eda_data.json', 'w', encoding='utf-8') as f:
for item in enhance_result:
line = json.dumps(item, ensure_ascii=False)
f.write(line + '\n')