Este projeto fornece um conjunto de ferramentas para capturar regiões da tela e detectar texto dentro de imagens usando dois métodos diferentes de OCR (Reconhecimento Óptico de Caracteres): Google Cloud Vision API e Tesseract.
Esta classe inicializa um aplicativo simples de captura de tela usando Tkinter. Exemplo:
from visionFusion import ScreenGrabber
grabber = screenGrabber()
Esta classe usa a API Google Cloud Vision para detectar texto em imagens de diferentes fontes. Inicialização
from pathlib import Path
from visionFusion import visionai
# Inicialize com credenciais do Google Cloud e proxy opcional
vision = visionai(creds=Path('caminho/para/creds.json'), proxy='http://seu.proxy:porta')
-
detect_text_from_file(path: Path) -> Union[List, None]
Detecta texto em um arquivo de imagem.
textos = vision.detect_text_from_file(Path('caminho/para/imagem.png'))
-
detect_text_from_url(url: str) -> Union[List, None]
Detecta texto em uma imagem a partir de uma URL.
textos = vision.detect_text_from_url('https://exemplo.com/imagem.png')
-
detect_text_from_screen_region(coordenadas: Tuple[int]) -> Union[List, None]
Detecta texto em uma região específica da tela.
textos = vision.detect_text_from_screen_region((0, 0, 100, 100))
Esta classe usa Tesseract OCR para detectar texto em imagens de diferentes fontes. Inicialização
from pathlib import Path
from visionFusion import tesseract
Inicialize com o caminho do executável do Tesseract
tess = tesseract(tesseract_executable=Path('caminho/para/tesseract'))
-
detect_text_from_file(path: Path) -> Union[str, None]
Detecta texto em um arquivo de imagem.
texto = tess.detect_text_from_file(Path('caminho/para/imagem.png'))
-
detect_text_from_url(url: str) -> Union[str, None]
Detecta texto em uma imagem a partir de uma URL.
texto = tess.detect_text_from_url('https://exemplo.com/imagem.png')
-
detect_text_from_screen_region(coordenadas: Tuple[int]) -> Union[str, None]
Detecta texto em uma região específica da tela.
texto = tess.detect_text_from_screen_region((0, 0, 100, 100))
Este projeto está licenciado sob a Licença MIT. Veja o arquivo LICENSE para mais detalhes.
Desenvolvido por Guilherme Eduardo Poças.
Sinta-se à vontade para entrar em contato com qualquer dúvida ou feedback!