Skip to content

Commit

Permalink
added explanation
Browse files Browse the repository at this point in the history
  • Loading branch information
Julia Miho Ichikawa Pocciotti authored and Julia Miho Ichikawa Pocciotti committed May 11, 2020
1 parent 9bf170e commit b7597aa
Showing 1 changed file with 13 additions and 3 deletions.
16 changes: 13 additions & 3 deletions word2vec_got.ipynb
Original file line number Diff line number Diff line change
Expand Up @@ -8,6 +8,16 @@
"Neste notebook, faremos uma análise dos roteiros da série Game of Thrones utilizando Word2Vec. Este dataset pode ser encontrado [aqui](https://www.kaggle.com/anderfj/game-of-thrones-series-scripts-breakdowns) "
]
},
{
"cell_type": "markdown",
"metadata": {},
"source": [
"### Breve explicação\n",
"A suposição feita pelo word2vec é a de que duas palavras que compartilham contextos semelhantes, também irão compartilhar uma representação vetorial semelhante do modelo. Por exemplo, se palavras como \"cachorrinho\" e \"fofo\" forem frequentemente usadas em situações semelhantes, logo, essas mesmas palavras também terão vetores similares em sua representação segundo o word2vec. \n",
"\n",
"É através desta suposição que o word2vec consegue encontrar relações entre as palavras em um dataset, computar a similaridade entre elas e usar a sua representação em vetores para essas palavras como input para outras aplicações, como classificação de texto ou clustering. "
]
},
{
"cell_type": "markdown",
"metadata": {},
Expand Down Expand Up @@ -825,7 +835,7 @@
},
{
"cell_type": "code",
"execution_count": 23,
"execution_count": 52,
"metadata": {},
"outputs": [],
"source": [
Expand All @@ -836,7 +846,7 @@
},
{
"cell_type": "code",
"execution_count": 24,
"execution_count": 53,
"metadata": {},
"outputs": [
{
Expand All @@ -845,7 +855,7 @@
"'tywin_lannister'"
]
},
"execution_count": 24,
"execution_count": 53,
"metadata": {},
"output_type": "execute_result"
}
Expand Down

0 comments on commit b7597aa

Please sign in to comment.