O WiseDog é uma solução inteligente desenvolvida durante o Hackathon Tractian. O projeto transforma áudios informais em listas de tarefas organizadas, utilizando Inteligência Artificial para transcrever falas e extrair automaticamente os pontos de ação mais relevantes, facilitando a gestão de tarefas do dia a dia. 🧠 Como Funciona
Captura de Áudio: O usuário seleciona ou grava um arquivo de áudio (formato OGG) através do aplicativo Android.
Processamento (Backend):
O áudio é convertido para MP3 utilizando a ferramenta FFmpeg.
A transcrição é realizada pelo modelo Whisper-1 da OpenAI.
O texto transcrito é analisado pelo GPT-3.5 Turbo, que gera uma lista de tarefas estruturada e acionável.
Visualização: O aplicativo Android recebe a resposta da API e apresenta as tarefas em uma interface de checklist intuitiva.
🛠️ Tecnologias e Dependências Backend (Python)
FastAPI: Framework ágil para a construção da API.
OpenAI API: Utilizada para transcrição (Whisper) e Processamento de Linguagem Natural (GPT).
FFmpeg: Ferramenta essencial para manipulação e conversão de formatos de áudio.
Uvicorn: Servidor ASGI de alta performance.
Frontend (Android)
Kotlin & Jetpack Compose: Interface de usuário moderna, fluida e declarativa.
Retrofit & OkHttp: Responsáveis pela comunicação eficiente com o servidor.
Coroutines: Garantem que as chamadas de rede ocorram de forma assíncrona, sem travar o aplicativo.
🚀 Configuração e Instalação Backend
Instale as bibliotecas necessárias:
Bash
pip install openai==0.28 fastapi uvicorn requests
Configure sua chave da API da OpenAI como variável de ambiente:
Bash
export OPENAI_API_KEY='sua_chave_aqui'
Inicie o servidor:
Bash
python main.py
Frontend
Abra a pasta do projeto Android no Android Studio.
No arquivo RetrofitClient.kt, certifique-se de que o BASE_URL aponta para o endereço IP onde o backend está rodando.
Sincronize o Gradle e execute o app em um emulador ou dispositivo físico.
📂 Estrutura do Projeto
├── main.py # Core do Backend (FastAPI)
├── translation.py # Módulo experimental de tradução
├── audio.ogg # Arquivo de áudio para testes
└── frontend/ # Código-fonte do aplicativo Android
├── app/src/main/java/com/example/wisedog/
│ ├── MainActivity.kt # Interface Principal (UI)
│ └── repository/ # Camada de rede e DTOs
└── build.gradle.kts # Configurações de build Android
📄 Licença
Este projeto foi desenvolvido para fins educacionais e de competição no Hackathon Tractian. Todos os direitos reservados aos desenvolvedores originais.