Skip to content

Conjunto de ferramentas para capturar regiões da tela e detectar texto dentro de imagens usando dois métodos diferentes de OCR: Google Cloud Vision API e Tesseract.

License

Notifications You must be signed in to change notification settings

Gpocas/visionFusion

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

15 Commits
 
 
 
 
 
 
 
 
 
 
 
 
 
 

Repository files navigation

Visão Geral

Este projeto fornece um conjunto de ferramentas para capturar regiões da tela e detectar texto dentro de imagens usando dois métodos diferentes de OCR (Reconhecimento Óptico de Caracteres): Google Cloud Vision API e Tesseract.

Uso

screenGrabber

Esta classe inicializa um aplicativo simples de captura de tela usando Tkinter. Exemplo:

from visionFusion import ScreenGrabber

grabber = screenGrabber()

visionai

Esta classe usa a API Google Cloud Vision para detectar texto em imagens de diferentes fontes. Inicialização

from pathlib import Path
from visionFusion import visionai

# Inicialize com credenciais do Google Cloud e proxy opcional
vision = visionai(creds=Path('caminho/para/creds.json'), proxy='http://seu.proxy:porta')

Métodos:

  • detect_text_from_file(path: Path) -> Union[List, None]

    Detecta texto em um arquivo de imagem.

    textos = vision.detect_text_from_file(Path('caminho/para/imagem.png'))
  • detect_text_from_url(url: str) -> Union[List, None]

    Detecta texto em uma imagem a partir de uma URL.

    textos = vision.detect_text_from_url('https://exemplo.com/imagem.png')
  • detect_text_from_screen_region(coordenadas: Tuple[int]) -> Union[List, None]

    Detecta texto em uma região específica da tela.

    textos = vision.detect_text_from_screen_region((0, 0, 100, 100))

tesseract

Esta classe usa Tesseract OCR para detectar texto em imagens de diferentes fontes. Inicialização

from pathlib import Path
from visionFusion import tesseract


Inicialize com o caminho do executável do Tesseract
tess = tesseract(tesseract_executable=Path('caminho/para/tesseract'))

Métodos:

  • detect_text_from_file(path: Path) -> Union[str, None]

    Detecta texto em um arquivo de imagem.

    texto = tess.detect_text_from_file(Path('caminho/para/imagem.png'))
  • detect_text_from_url(url: str) -> Union[str, None]

    Detecta texto em uma imagem a partir de uma URL.

    texto = tess.detect_text_from_url('https://exemplo.com/imagem.png')
  • detect_text_from_screen_region(coordenadas: Tuple[int]) -> Union[str, None]

    Detecta texto em uma região específica da tela.

    texto = tess.detect_text_from_screen_region((0, 0, 100, 100))

Licença

Este projeto está licenciado sob a Licença MIT. Veja o arquivo LICENSE para mais detalhes.

Autor

Desenvolvido por Guilherme Eduardo Poças.

Sinta-se à vontade para entrar em contato com qualquer dúvida ou feedback!

About

Conjunto de ferramentas para capturar regiões da tela e detectar texto dentro de imagens usando dois métodos diferentes de OCR: Google Cloud Vision API e Tesseract.

Resources

License

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published

Languages