From 54afd61ad9b3b154428f456162f7d48336c83579 Mon Sep 17 00:00:00 2001 From: kavos Date: Sun, 18 Aug 2024 12:31:04 +0900 Subject: [PATCH 1/4] jupy test --- src/tag/keytest.ipynb | 201 +++++++++++++++++++ src/tag/keytesten.ipynb | 136 +++++++++++++ src/tag/keytestja.ipynb | 418 ++++++++++++++++++++++++++++++++++++++++ 3 files changed, 755 insertions(+) create mode 100644 src/tag/keytest.ipynb create mode 100644 src/tag/keytesten.ipynb create mode 100644 src/tag/keytestja.ipynb diff --git a/src/tag/keytest.ipynb b/src/tag/keytest.ipynb new file mode 100644 index 0000000..567658b --- /dev/null +++ b/src/tag/keytest.ipynb @@ -0,0 +1,201 @@ +{ + "cells": [ + { + "cell_type": "code", + "id": "initial_id", + "metadata": { + "ExecuteTime": { + "end_time": "2024-08-18T02:54:00.706752Z", + "start_time": "2024-08-18T02:54:00.680450Z" + } + }, + "source": [ + "import pke\n", + "from pke.lang import stopwords\n", + "from torch.ao.nn.quantized.functional import threshold\n", + "pke.base.ISO_to_languege['ja_ginza'] = 'japanese'\n", + "import ginza\n", + "import nltk\n", + "\n", + "stopwords = list(ginza.STOP_WORDS)" + ], + "outputs": [ + { + "ename": "AttributeError", + "evalue": "module 'pke.base' has no attribute 'ISO_to_languege'", + "output_type": "error", + "traceback": [ + "\u001B[0;31m---------------------------------------------------------------------------\u001B[0m", + "\u001B[0;31mAttributeError\u001B[0m Traceback (most recent call last)", + "Cell \u001B[0;32mIn[7], line 4\u001B[0m\n\u001B[1;32m 2\u001B[0m \u001B[38;5;28;01mfrom\u001B[39;00m \u001B[38;5;21;01mpke\u001B[39;00m\u001B[38;5;21;01m.\u001B[39;00m\u001B[38;5;21;01mlang\u001B[39;00m \u001B[38;5;28;01mimport\u001B[39;00m stopwords\n\u001B[1;32m 3\u001B[0m \u001B[38;5;28;01mfrom\u001B[39;00m \u001B[38;5;21;01mtorch\u001B[39;00m\u001B[38;5;21;01m.\u001B[39;00m\u001B[38;5;21;01mao\u001B[39;00m\u001B[38;5;21;01m.\u001B[39;00m\u001B[38;5;21;01mnn\u001B[39;00m\u001B[38;5;21;01m.\u001B[39;00m\u001B[38;5;21;01mquantized\u001B[39;00m\u001B[38;5;21;01m.\u001B[39;00m\u001B[38;5;21;01mfunctional\u001B[39;00m \u001B[38;5;28;01mimport\u001B[39;00m threshold\n\u001B[0;32m----> 4\u001B[0m \u001B[43mpke\u001B[49m\u001B[38;5;241;43m.\u001B[39;49m\u001B[43mbase\u001B[49m\u001B[38;5;241;43m.\u001B[39;49m\u001B[43mISO_to_languege\u001B[49m[\u001B[38;5;124m'\u001B[39m\u001B[38;5;124mja_ginza\u001B[39m\u001B[38;5;124m'\u001B[39m] \u001B[38;5;241m=\u001B[39m \u001B[38;5;124m'\u001B[39m\u001B[38;5;124mjapanese\u001B[39m\u001B[38;5;124m'\u001B[39m\n\u001B[1;32m 5\u001B[0m \u001B[38;5;28;01mimport\u001B[39;00m \u001B[38;5;21;01mginza\u001B[39;00m\n\u001B[1;32m 6\u001B[0m \u001B[38;5;28;01mimport\u001B[39;00m \u001B[38;5;21;01mnltk\u001B[39;00m\n", + "\u001B[0;31mAttributeError\u001B[0m: module 'pke.base' has no attribute 'ISO_to_languege'" + ] + } + ], + "execution_count": 7 + }, + { + "metadata": { + "ExecuteTime": { + "end_time": "2024-08-18T02:53:48.132517Z", + "start_time": "2024-08-18T02:53:48.086435Z" + } + }, + "cell_type": "code", + "source": [ + "nltk.corpus.stopwords.words_org = nltk.corpus.stopwords.words \n", + "nltk.corpus.stopwords.words = lambda lang : stopwords if lang == 'japanese' else nltk.corpus.stopwords.words_org(lang)" + ], + "id": "e85c1dc1ad8406d5", + "outputs": [ + { + "ename": "NameError", + "evalue": "name 'nltk' is not defined", + "output_type": "error", + "traceback": [ + "\u001B[0;31m---------------------------------------------------------------------------\u001B[0m", + "\u001B[0;31mNameError\u001B[0m Traceback (most recent call last)", + "Cell \u001B[0;32mIn[6], line 1\u001B[0m\n\u001B[0;32m----> 1\u001B[0m nltk\u001B[38;5;241m.\u001B[39mcorpus\u001B[38;5;241m.\u001B[39mstopwords\u001B[38;5;241m.\u001B[39mwords_org \u001B[38;5;241m=\u001B[39m \u001B[43mnltk\u001B[49m\u001B[38;5;241m.\u001B[39mcorpus\u001B[38;5;241m.\u001B[39mstopwords\u001B[38;5;241m.\u001B[39mwords \n\u001B[1;32m 2\u001B[0m nltk\u001B[38;5;241m.\u001B[39mcorpus\u001B[38;5;241m.\u001B[39mstopwords\u001B[38;5;241m.\u001B[39mwords \u001B[38;5;241m=\u001B[39m \u001B[38;5;28;01mlambda\u001B[39;00m lang : stopwords \u001B[38;5;28;01mif\u001B[39;00m lang \u001B[38;5;241m==\u001B[39m \u001B[38;5;124m'\u001B[39m\u001B[38;5;124mjapanese\u001B[39m\u001B[38;5;124m'\u001B[39m \u001B[38;5;28;01melse\u001B[39;00m nltk\u001B[38;5;241m.\u001B[39mcorpus\u001B[38;5;241m.\u001B[39mstopwords\u001B[38;5;241m.\u001B[39mwords_org(lang)\n", + "\u001B[0;31mNameError\u001B[0m: name 'nltk' is not defined" + ] + } + ], + "execution_count": 6 + }, + { + "cell_type": "code", + "id": "3d92e1849fa3eeda", + "metadata": { + "ExecuteTime": { + "end_time": "2024-08-18T02:41:51.555118Z", + "start_time": "2024-08-18T02:41:51.549402Z" + } + }, + "source": "text = \"1885年(明治18年)9月に明治政府指定の旧国道8号[注釈 1]として開通した当時は馬車の通行が可能な規格で整備されており、馬車同士がすれ違うこともできたほどの幅員の広い車道で、新潟県側の最奥部付近には短いながらもトンネルが設けられるなど、当時としては破格な高規格の山岳道路だった。しかし開通から程なくして各所で土砂崩れや雪崩などによる路盤決壊や橋の流失が相次ぎ、前述のトンネルも崩壊埋没してしまい、ついには車両通行そのものが完全に不可能となってしまった。その後現在に至るまで車道として再開通させる具体的な計画は立てられていない[21]。群馬県側は、谷川岳ロープウェイ土合口駅前先の谷川岳登山指導センター下(谷川岳山岳資料館前) - 一ノ倉沢(車道終点)の区間で一般車両の通行が通年規制されている(冬季は歩行者を含め通行止め)[22][23]。冬季閉鎖期間外は、みなかみ町が土合口駅前 - 一ノ倉沢間で観光向け電気バスを運行している[22]。その先の一ノ倉沢 - 芝倉沢 - 清水峠 - 居坪坂(井坪坂)分岐の区間は徒歩で通行可能[24]。ただし、峠上にある掘割の部分は現在では登山道として活用されていない。新潟県側の居坪坂[注釈 12]によりバイパスされた区間は、法令上はれっきとした現役の国道であり続けていながら、すでに自然に還っている[24]。この区間では先述のトンネルの崩壊により早い時期から歩行者すら通り抜け不能となっているため、事実上の廃道状態となって100年以上が経過しており、徒歩通行どころか立ち入ることさえも困難なほど壊滅的に荒廃している[21]。代替ルートとして、登山者は清水峠から居坪坂もしくは明治期以前の古道である十五里尾根(謙信尾根)の登山道を経由して清水へ向かうことになる[24]。\"", + "outputs": [], + "execution_count": 3 + }, + { + "cell_type": "code", + "id": "11643b4055c19a5e", + "metadata": { + "ExecuteTime": { + "end_time": "2024-08-18T02:41:51.600600Z", + "start_time": "2024-08-18T02:41:51.594726Z" + } + }, + "source": [ + "extractor = pke.unsupervised.MultipartiteRank()" + ], + "outputs": [], + "execution_count": 4 + }, + { + "cell_type": "code", + "id": "cac24a5e1fa71733", + "metadata": { + "ExecuteTime": { + "end_time": "2024-08-18T02:44:19.960952Z", + "start_time": "2024-08-18T02:44:05.306619Z" + } + }, + "source": [ + "extractor.load_document(input=text, language='ja', normalization=None)\n", + "extractor.candidate_selection(pos={'NOUN', 'PROPN', 'ADJ', 'NUM'})\n", + "extractor.candidate_weighting(threshold=0.74, method='average', alpha=1.1)" + ], + "outputs": [ + { + "name": "stderr", + "output_type": "stream", + "text": [ + "WARNING:root:No stoplist available in pke for 'ja' language.\n", + "/home/utfo/.local/lib/python3.10/site-packages/huggingface_hub/file_download.py:1150: FutureWarning: `resume_download` is deprecated and will be removed in version 1.0.0. Downloads always resume when possible. If you want to force a new download, use `force_download=True`.\n", + " warnings.warn(\n", + "error We couldn't connect to 'https://huggingface.co' to load this file, couldn't find it in the cached files and it looks like megagonlabs/transformers-ud-japanese-electra-base-ginza-510 is not the path to a directory containing a file named config.json.\n", + "Checkout your internet connection or see how to run the library in offline mode at 'https://huggingface.co/docs/transformers/installation#offline-mode'.\n", + "error Can't load the configuration of '/tmp/tmpzmvhaykz/config.json'. If you were trying to load it from 'https://huggingface.co/models', make sure you don't have a local directory with the same name. Otherwise, make sure '/tmp/tmpzmvhaykz/config.json' is the correct path to a directory containing a config.json file\n", + "trying to download model from huggingface hub: megagonlabs/transformers-ud-japanese-electra-base-ginza-510 ...\n" + ] + }, + { + "data": { + "text/plain": [ + "config.json: 0%| | 0.00/815 [00:00 falling back to porter stemmer.\n" + ] + } + ], + "execution_count": 53 + }, + { + "metadata": { + "ExecuteTime": { + "end_time": "2024-08-18T03:17:52.793371Z", + "start_time": "2024-08-18T03:17:52.790251Z" + } + }, + "cell_type": "code", + "source": "", + "id": "f6a3f29b63739d57", + "outputs": [], + "execution_count": null + }, + { + "metadata": { + "ExecuteTime": { + "end_time": "2024-08-18T03:17:52.856582Z", + "start_time": "2024-08-18T03:17:52.841667Z" + } + }, + "cell_type": "code", + "source": [ + "extractor.candidate_selection(pos={'NOUN', 'PROPN'})\n", + "extractor.candidate_weighting()\n", + "data = extractor.get_n_best(n=30)" + ], + "id": "3e734bd97157fa0c", + "outputs": [], + "execution_count": 54 + }, + { + "metadata": { + "ExecuteTime": { + "end_time": "2024-08-18T03:17:52.911336Z", + "start_time": "2024-08-18T03:17:52.904356Z" + } + }, + "cell_type": "code", + "source": [ + "import pandas as pd\n", + "df = pd.DataFrame(data)\n", + "print(df)" + ], + "id": "e816b7accd49e8b1", + "outputs": [ + { + "name": "stdout", + "output_type": "stream", + "text": [ + " 0 1\n", + "0 物価高 0.058218\n", + "1 低所得者 0.046998\n", + "2 マイナス 0.046457\n", + "3 アベノミクス 0.042669\n", + "4 食料 不足 0.038713\n", + "5 エネルギー 0.035776\n", + "6 ウクライナ 危機 0.032103\n", + "7 暮らし 0.031508\n", + "8 自動車 0.030254\n", + "9 成長 優先 0.030217\n", + "10 引き金 0.030085\n", + "11 賃上げ 0.030064\n", + "12 首相 肝煎り 0.029691\n", + "13 定額 減税 0.029445\n", + "14 生産 停止 0.029271\n", + "15 懸念 材料 0.028990\n", + "16 金融市場 0.028825\n", + "17 名目 成長率 0.027124\n", + "18 給付金 支給 0.026384\n", + "19 プラス 0.025883\n", + "20 カ月 ぶり 0.025572\n", + "21 gdp 0.025542\n", + "22 実質 賃金 0.025484\n", + "23 名目 国内総生産 0.025413\n", + "24 物価上昇 0.023598\n", + "25 ボーナス 0.023295\n", + "26 ダイハツ工業 0.022398\n", + "27 消費 支出 0.020713\n", + "28 ケース 0.019810\n", + "29 格差 是正 0.019733\n" + ] + } + ], + "execution_count": 55 + }, + { + "metadata": { + "ExecuteTime": { + "end_time": "2024-08-18T03:19:40.798601Z", + "start_time": "2024-08-18T03:19:40.769181Z" + } + }, + "cell_type": "code", + "source": "df", + "id": "8f92fb9f35dd4444", + "outputs": [ + { + "data": { + "text/plain": [ + " 0 1\n", + "0 物価高 0.058218\n", + "1 低所得者 0.046998\n", + "2 マイナス 0.046457\n", + "3 アベノミクス 0.042669\n", + "4 食料 不足 0.038713\n", + "5 エネルギー 0.035776\n", + "6 ウクライナ 危機 0.032103\n", + "7 暮らし 0.031508\n", + "8 自動車 0.030254\n", + "9 成長 優先 0.030217\n", + "10 引き金 0.030085\n", + "11 賃上げ 0.030064\n", + "12 首相 肝煎り 0.029691\n", + "13 定額 減税 0.029445\n", + "14 生産 停止 0.029271\n", + "15 懸念 材料 0.028990\n", + "16 金融市場 0.028825\n", + "17 名目 成長率 0.027124\n", + "18 給付金 支給 0.026384\n", + "19 プラス 0.025883\n", + "20 カ月 ぶり 0.025572\n", + "21 gdp 0.025542\n", + "22 実質 賃金 0.025484\n", + "23 名目 国内総生産 0.025413\n", + "24 物価上昇 0.023598\n", + "25 ボーナス 0.023295\n", + "26 ダイハツ工業 0.022398\n", + "27 消費 支出 0.020713\n", + "28 ケース 0.019810\n", + "29 格差 是正 0.019733" + ], + "text/html": [ + "
\n", + "\n", + "\n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + "
01
0物価高0.058218
1低所得者0.046998
2マイナス0.046457
3アベノミクス0.042669
4食料 不足0.038713
5エネルギー0.035776
6ウクライナ 危機0.032103
7暮らし0.031508
8自動車0.030254
9成長 優先0.030217
10引き金0.030085
11賃上げ0.030064
12首相 肝煎り0.029691
13定額 減税0.029445
14生産 停止0.029271
15懸念 材料0.028990
16金融市場0.028825
17名目 成長率0.027124
18給付金 支給0.026384
19プラス0.025883
20カ月 ぶり0.025572
21gdp0.025542
22実質 賃金0.025484
23名目 国内総生産0.025413
24物価上昇0.023598
25ボーナス0.023295
26ダイハツ工業0.022398
27消費 支出0.020713
28ケース0.019810
29格差 是正0.019733
\n", + "
" + ] + }, + "execution_count": 56, + "metadata": {}, + "output_type": "execute_result" + } + ], + "execution_count": 56 + }, + { + "metadata": {}, + "cell_type": "code", + "outputs": [], + "execution_count": null, + "source": "", + "id": "7cc9849eb6fbba6" + } + ], + "metadata": { + "kernelspec": { + "display_name": "Python 3", + "language": "python", + "name": "python3" + }, + "language_info": { + "codemirror_mode": { + "name": "ipython", + "version": 2 + }, + "file_extension": ".py", + "mimetype": "text/x-python", + "name": "python", + "nbconvert_exporter": "python", + "pygments_lexer": "ipython2", + "version": "2.7.6" + } + }, + "nbformat": 4, + "nbformat_minor": 5 +} From 36f9606188019a77174bac723c9caacd32d9ba79 Mon Sep 17 00:00:00 2001 From: kavos Date: Sun, 18 Aug 2024 12:31:12 +0900 Subject: [PATCH 2/4] python code --- src/tag/keytest.py | 1 + src/tag/keyword.py | 9 +++++++++ 2 files changed, 10 insertions(+) create mode 100644 src/tag/keytest.py create mode 100644 src/tag/keyword.py diff --git a/src/tag/keytest.py b/src/tag/keytest.py new file mode 100644 index 0000000..b692a14 --- /dev/null +++ b/src/tag/keytest.py @@ -0,0 +1 @@ +import pke diff --git a/src/tag/keyword.py b/src/tag/keyword.py new file mode 100644 index 0000000..91c93c1 --- /dev/null +++ b/src/tag/keyword.py @@ -0,0 +1,9 @@ +import pke + +extractor = pke.unsupervised.TopicRank() + +def keyword_extract(text, n): + extractor.load_document(input=text, language='ja') + extractor.candidate_selection(pos={'NOUN', 'PROPN'}) + extractor.candidate_weighting() + return extractor.get_n_best(n=n) \ No newline at end of file From e37e2263bbf703a07824691b2bcc9871dec83af8 Mon Sep 17 00:00:00 2001 From: kavos Date: Sun, 18 Aug 2024 12:32:44 +0900 Subject: [PATCH 3/4] del test --- src/tag/keytest.py | 1 - 1 file changed, 1 deletion(-) delete mode 100644 src/tag/keytest.py diff --git a/src/tag/keytest.py b/src/tag/keytest.py deleted file mode 100644 index b692a14..0000000 --- a/src/tag/keytest.py +++ /dev/null @@ -1 +0,0 @@ -import pke From fb1dd619650dea6fc937bddee60eac8abae32ec1 Mon Sep 17 00:00:00 2001 From: kavos Date: Sun, 18 Aug 2024 12:35:18 +0900 Subject: [PATCH 4/4] fix text --- src/tag/keytestja.ipynb | 300 +++++++++++++++++----------------------- 1 file changed, 128 insertions(+), 172 deletions(-) diff --git a/src/tag/keytestja.ipynb b/src/tag/keytestja.ipynb index 30faba1..d8f3aae 100644 --- a/src/tag/keytestja.ipynb +++ b/src/tag/keytestja.ipynb @@ -6,45 +6,45 @@ "metadata": { "collapsed": true, "ExecuteTime": { - "end_time": "2024-08-18T03:17:46.334404Z", - "start_time": "2024-08-18T03:17:46.330764Z" + "end_time": "2024-08-18T03:34:30.834699Z", + "start_time": "2024-08-18T03:34:30.809066Z" } }, "source": "import pke", "outputs": [], - "execution_count": 50 + "execution_count": 57 }, { "metadata": { "ExecuteTime": { - "end_time": "2024-08-18T03:17:46.393399Z", - "start_time": "2024-08-18T03:17:46.387661Z" + "end_time": "2024-08-18T03:34:30.881859Z", + "start_time": "2024-08-18T03:34:30.866013Z" } }, "cell_type": "code", "source": "extractor = pke.unsupervised.TopicRank()", "id": "44a16eace18b6f62", "outputs": [], - "execution_count": 51 + "execution_count": 58 }, { "metadata": { "ExecuteTime": { - "end_time": "2024-08-18T03:17:46.448168Z", - "start_time": "2024-08-18T03:17:46.443720Z" + "end_time": "2024-08-18T03:34:31.061078Z", + "start_time": "2024-08-18T03:34:31.055549Z" } }, "cell_type": "code", - "source": "test = \"経済規模がいくら大きくなっても、物価高に苦しむ国民の多くは実感が湧かないだろう。今年4~6月期の名目国内総生産(GDP)が年換算で初めて600兆円を超えた。「戦後最大の経済」を目指した安倍晋三元首相が2015年にアベノミクスの柱に据えた目標である。引き継いだ岸田文雄首相は「成長型経済への移行を示す数字だ」と自賛した。だが政権の成果とは言い難い。名目成長率はバブル期並みの7%強に達したが、押し上げたのは物価高だ。ウクライナ危機に伴うエネルギー・食料不足が引き金となり、大幅な円安が拍車をかけた。 物価上昇を差し引いた実質は550兆円台にとどまる。ウクライナ危機前とほぼ変わらず、国民がより豊かになったわけではない。実質の成長率は3%台と1~3月期のマイナスからは回復した。ただ、ダイハツ工業などの不正による自動車の生産停止で落ち込んだ分が持ち直したに過ぎないと指摘される。国民が生活を切り詰める傾向は依然として根強い。物価上昇を除いた実質賃金は6月、2年3カ月ぶりに前年比でプラスとなったが、ボーナスの増加という一時的な要因が大きい。家計の消費支出は低調なままだ。6月に始まった首相肝煎りの定額減税も消費を押し上げる効果は限定的との見方が強い。将来の暮らしに不安を抱える家庭が貯蓄に回すケースも少なくないからだ。最近の急速な円高など不安定な金融市場も懸念材料である。円安で押し上げられた企業の業績が悪化すれば、今後の賃上げにマイナスに働きかねない。物価高の打撃は低所得者に集中する。首相は当初、分配を重視する姿勢を示していたが、成長優先のアベノミクスに回帰した。低所得者には給付金支給というその場しのぎの対応を繰り返した。格差是正に本格的に取り組まず、非正規雇用の比率は4割近くに高止まりしている。低賃金労働に依存する構造を変えなかったため、消費の停滞からも脱却できなかったのではないか。首相の退陣表明で、経済の再生は新政権に持ち越された。規模のアピールではなく、暮らしを底上げする政策こそ優先すべきだ。\"", + "source": "test = \"ハプト藻に関する最古の記載はエーレンベルク(1836)によるものである。彼はバルト海周辺の石灰岩層から微細な円板状の構造物(円石=coccolith)を発見した。しかし彼は、この構造物を生物由来ではなく、化学的、無機的要因によって生成したものと考えた。その後ハクスリー(1858)が同様の構造物を海底の堆積物の中から発見したが、やはり円石は非生物起源であると考えられた。円石を初めて生物起源であるとしたのは ウォーリッチ(1860)と ソービー(1861)である。彼らは円石が多数結合して中空の球を形成したものを発見し、coccosphere と命名した。現在この語は、円石を持つ細胞全体を、原形質を含めて表す単語として用いられている。しかしながら彼は円石藻という微細藻の存在を提唱したのではなく、coccosphere を有孔虫の生活環の一部と考えるに留まった。1870年代に入ると再び エーレンベルク の円石非生物由来説が支持されるようになった。特に円石の幾何学的な形状から、炭酸カルシウムの凝結、結晶化によると考えられる事が多かった。円石の持ち主を微細藻であると提唱したのは ワイヴィル・トムソン(1874)である。この時初めて円石は単細胞藻の外被であると考えられた。その後、coccosphere の中に色素体があるという報告や、Murray とBlackman(1898)による細胞分裂の描写が為されるに至り、単細胞藻としての円石藻-ハプト藻が認識される事となった。分類上のハプト藻は、体制と光合成色素の類似から、古くは不等毛植物門黄金色藻綱に含められていた経緯がある。ハプト植物門として独立したのは近年(1962)である。\"", "id": "5078f559f316e3d", "outputs": [], - "execution_count": 52 + "execution_count": 59 }, { "metadata": { "ExecuteTime": { - "end_time": "2024-08-18T03:17:52.736378Z", - "start_time": "2024-08-18T03:17:46.518714Z" + "end_time": "2024-08-18T03:34:44.896369Z", + "start_time": "2024-08-18T03:34:31.103512Z" } }, "cell_type": "code", @@ -66,13 +66,13 @@ ] } ], - "execution_count": 53 + "execution_count": 60 }, { "metadata": { "ExecuteTime": { - "end_time": "2024-08-18T03:17:52.793371Z", - "start_time": "2024-08-18T03:17:52.790251Z" + "end_time": "2024-08-18T03:34:44.940568Z", + "start_time": "2024-08-18T03:34:44.937601Z" } }, "cell_type": "code", @@ -84,8 +84,8 @@ { "metadata": { "ExecuteTime": { - "end_time": "2024-08-18T03:17:52.856582Z", - "start_time": "2024-08-18T03:17:52.841667Z" + "end_time": "2024-08-18T03:34:45.054235Z", + "start_time": "2024-08-18T03:34:44.994039Z" } }, "cell_type": "code", @@ -96,13 +96,13 @@ ], "id": "3e734bd97157fa0c", "outputs": [], - "execution_count": 54 + "execution_count": 61 }, { "metadata": { "ExecuteTime": { - "end_time": "2024-08-18T03:17:52.911336Z", - "start_time": "2024-08-18T03:17:52.904356Z" + "end_time": "2024-08-18T03:34:45.125518Z", + "start_time": "2024-08-18T03:34:45.083392Z" } }, "cell_type": "code", @@ -117,47 +117,40 @@ "name": "stdout", "output_type": "stream", "text": [ - " 0 1\n", - "0 物価高 0.058218\n", - "1 低所得者 0.046998\n", - "2 マイナス 0.046457\n", - "3 アベノミクス 0.042669\n", - "4 食料 不足 0.038713\n", - "5 エネルギー 0.035776\n", - "6 ウクライナ 危機 0.032103\n", - "7 暮らし 0.031508\n", - "8 自動車 0.030254\n", - "9 成長 優先 0.030217\n", - "10 引き金 0.030085\n", - "11 賃上げ 0.030064\n", - "12 首相 肝煎り 0.029691\n", - "13 定額 減税 0.029445\n", - "14 生産 停止 0.029271\n", - "15 懸念 材料 0.028990\n", - "16 金融市場 0.028825\n", - "17 名目 成長率 0.027124\n", - "18 給付金 支給 0.026384\n", - "19 プラス 0.025883\n", - "20 カ月 ぶり 0.025572\n", - "21 gdp 0.025542\n", - "22 実質 賃金 0.025484\n", - "23 名目 国内総生産 0.025413\n", - "24 物価上昇 0.023598\n", - "25 ボーナス 0.023295\n", - "26 ダイハツ工業 0.022398\n", - "27 消費 支出 0.020713\n", - "28 ケース 0.019810\n", - "29 格差 是正 0.019733\n" + " 0 1\n", + "0 構造物 0.101365\n", + "1 coccosphere 0.074264\n", + "2 生物 由来 0.071217\n", + "3 細胞 全体 0.058717\n", + "4 murray 0.047449\n", + "5 blackman 0.047378\n", + "6 ワイヴィル 0.045306\n", + "7 トムソン 0.044693\n", + "8 炭酸 カルシウム 0.040443\n", + "9 エーレンベルク 0.039854\n", + "10 結晶化 0.037827\n", + "11 色素体 0.036790\n", + "12 coccolith 0.036182\n", + "13 化学的 0.035431\n", + "14 原形質 0.034118\n", + "15 堆積物 0.034099\n", + "16 幾何学 0.032904\n", + "17 その後 ハクスリー 0.031758\n", + "18 ウォー 0.031595\n", + "19 持ち主 0.030283\n", + "20 生活環 0.029922\n", + "21 ソービー 0.029472\n", + "22 石灰 岩層 0.028933\n" ] } ], - "execution_count": 55 + "execution_count": 62 }, { "metadata": { "ExecuteTime": { - "end_time": "2024-08-18T03:19:40.798601Z", - "start_time": "2024-08-18T03:19:40.769181Z" + "end_time": "2024-08-18T03:34:45.198815Z", + "start_time": "2024-08-18T03:34:45.179950Z" } }, "cell_type": "code", @@ -167,37 +160,30 @@ { "data": { "text/plain": [ - " 0 1\n", - "0 物価高 0.058218\n", - "1 低所得者 0.046998\n", - "2 マイナス 0.046457\n", - "3 アベノミクス 0.042669\n", - "4 食料 不足 0.038713\n", - "5 エネルギー 0.035776\n", - "6 ウクライナ 危機 0.032103\n", - "7 暮らし 0.031508\n", - "8 自動車 0.030254\n", - "9 成長 優先 0.030217\n", - "10 引き金 0.030085\n", - "11 賃上げ 0.030064\n", - "12 首相 肝煎り 0.029691\n", - "13 定額 減税 0.029445\n", - "14 生産 停止 0.029271\n", - "15 懸念 材料 0.028990\n", - "16 金融市場 0.028825\n", - "17 名目 成長率 0.027124\n", - "18 給付金 支給 0.026384\n", - "19 プラス 0.025883\n", - "20 カ月 ぶり 0.025572\n", - "21 gdp 0.025542\n", - "22 実質 賃金 0.025484\n", - "23 名目 国内総生産 0.025413\n", - "24 物価上昇 0.023598\n", - "25 ボーナス 0.023295\n", - "26 ダイハツ工業 0.022398\n", - "27 消費 支出 0.020713\n", - "28 ケース 0.019810\n", - "29 格差 是正 0.019733" + " 0 1\n", + "0 構造物 0.101365\n", + "1 coccosphere 0.074264\n", + "2 生物 由来 0.071217\n", + "3 細胞 全体 0.058717\n", + "4 murray 0.047449\n", + "5 blackman 0.047378\n", + "6 ワイヴィル 0.045306\n", + "7 トムソン 0.044693\n", + "8 炭酸 カルシウム 0.040443\n", + "9 エーレンベルク 0.039854\n", + "10 結晶化 0.037827\n", + "11 色素体 0.036790\n", + "12 coccolith 0.036182\n", + "13 化学的 0.035431\n", + "14 原形質 0.034118\n", + "15 堆積物 0.034099\n", + "16 幾何学 0.032904\n", + "17 その後 ハクスリー 0.031758\n", + "18 ウォー 0.031595\n", + "19 持ち主 0.030283\n", + "20 生活環 0.029922\n", + "21 ソービー 0.029472\n", + "22 石灰 岩層 0.028933" ], "text/html": [ "
\n", @@ -225,173 +211,143 @@ " \n", " \n", " 0\n", - " 物価高\n", - " 0.058218\n", + " 構造物\n", + " 0.101365\n", " \n", " \n", " 1\n", - " 低所得者\n", - " 0.046998\n", + " coccosphere\n", + " 0.074264\n", " \n", " \n", " 2\n", - " マイナス\n", - " 0.046457\n", + " 生物 由来\n", + " 0.071217\n", " \n", " \n", " 3\n", - " アベノミクス\n", - " 0.042669\n", + " 細胞 全体\n", + " 0.058717\n", " \n", " \n", " 4\n", - " 食料 不足\n", - " 0.038713\n", + " murray\n", + " 0.047449\n", " \n", " \n", " 5\n", - " エネルギー\n", - " 0.035776\n", + " blackman\n", + " 0.047378\n", " \n", " \n", " 6\n", - " ウクライナ 危機\n", - " 0.032103\n", + " ワイヴィル\n", + " 0.045306\n", " \n", " \n", " 7\n", - " 暮らし\n", - " 0.031508\n", + " トムソン\n", + " 0.044693\n", " \n", " \n", " 8\n", - " 自動車\n", - " 0.030254\n", + " 炭酸 カルシウム\n", + " 0.040443\n", " \n", " \n", " 9\n", - " 成長 優先\n", - " 0.030217\n", + " エーレンベルク\n", + " 0.039854\n", " \n", " \n", " 10\n", - " 引き金\n", - " 0.030085\n", + " 結晶化\n", + " 0.037827\n", " \n", " \n", " 11\n", - " 賃上げ\n", - " 0.030064\n", + " 色素体\n", + " 0.036790\n", " \n", " \n", " 12\n", - " 首相 肝煎り\n", - " 0.029691\n", + " coccolith\n", + " 0.036182\n", " \n", " \n", " 13\n", - " 定額 減税\n", - " 0.029445\n", + " 化学的\n", + " 0.035431\n", " \n", " \n", " 14\n", - " 生産 停止\n", - " 0.029271\n", + " 原形質\n", + " 0.034118\n", " \n", " \n", " 15\n", - " 懸念 材料\n", - " 0.028990\n", + " 堆積物\n", + " 0.034099\n", " \n", " \n", " 16\n", - " 金融市場\n", - " 0.028825\n", + " 幾何学\n", + " 0.032904\n", " \n", " \n", " 17\n", - " 名目 成長率\n", - " 0.027124\n", + " その後 ハクスリー\n", + " 0.031758\n", " \n", " \n", " 18\n", - " 給付金 支給\n", - " 0.026384\n", + " ウォー\n", + " 0.031595\n", " \n", " \n", " 19\n", - " プラス\n", - " 0.025883\n", + " 持ち主\n", + " 0.030283\n", " \n", " \n", " 20\n", - " カ月 ぶり\n", - " 0.025572\n", + " 生活環\n", + " 0.029922\n", " \n", " \n", " 21\n", - " gdp\n", - " 0.025542\n", + " ソービー\n", + " 0.029472\n", " \n", " \n", " 22\n", - " 実質 賃金\n", - " 0.025484\n", - " \n", - " \n", - " 23\n", - " 名目 国内総生産\n", - " 0.025413\n", - " \n", - " \n", - " 24\n", - " 物価上昇\n", - " 0.023598\n", - " \n", - " \n", - " 25\n", - " ボーナス\n", - " 0.023295\n", - " \n", - " \n", - " 26\n", - " ダイハツ工業\n", - " 0.022398\n", - " \n", - " \n", - " 27\n", - " 消費 支出\n", - " 0.020713\n", - " \n", - " \n", - " 28\n", - " ケース\n", - " 0.019810\n", - " \n", - " \n", - " 29\n", - " 格差 是正\n", - " 0.019733\n", + " 石灰 岩層\n", + " 0.028933\n", " \n", " \n", "\n", "
" ] }, - "execution_count": 56, + "execution_count": 63, "metadata": {}, "output_type": "execute_result" } ], - "execution_count": 56 + "execution_count": 63 }, { - "metadata": {}, + "metadata": { + "ExecuteTime": { + "end_time": "2024-08-18T03:34:45.314961Z", + "start_time": "2024-08-18T03:34:45.311715Z" + } + }, "cell_type": "code", - "outputs": [], - "execution_count": null, "source": "", - "id": "7cc9849eb6fbba6" + "id": "7cc9849eb6fbba6", + "outputs": [], + "execution_count": null } ], "metadata": {