Info: Néhány projekt elavult és törölve van, így lehetséges, hogy néhány link már nem található.
Összefoglaló
🎙️ A P3X Meeting Assistant egy valós idejű, mesterséges intelligencián alapuló beszéd-szöveg alkalmazás megbeszélésekhez és beszélgetésekhez — pip-pel telepíthető Python csomagként (p3x-meet-assistant) elérhető —, amely rögzíti a beszélő hangját, élőben átírja az OpenAI GPT-4o Transcribe használatával (a ma elérhető legpontosabb beszédmodell), és hangujjlenyomat alapján automatikusan címkézi az egyes megszólalásokat GPU-gyorsított beszélő-diarizációval (1. beszélő, 2. beszélő, ...). 10 európai nyelvet támogat alapból (angol, magyar, német, francia, spanyol, olasz, portugál, holland, lengyel, cseh), és teljes böngésző-alapú felhasználói felülettel rendelkezik sötét/világos témákkal, állítható betűmérettel és egyklikkes átirat exporttal, miközben minden munkamenet automatikusan időbélyegzett szövegfájlba mentődik. Linuxon natívan rögzíti a rendszerhangot PulseAudio/PipeWire segítségével, macOS és Windows alatt böngészőfül-hangrögzítéssel (Google Meet, Zoom, Teams, YouTube — bármi, ami megosztható hanggal rendelkezik), NVIDIA CUDA GPU diarizációval Linuxon/Windowson, Apple Silicon Metal gyorsítással macOS-en és sima CPU tartalékolással mindenhol. Linuxon, macOS-en és Windowson is működik — telepítés: pip install p3x-meet-assistant, állítsa be az OpenAI API kulcsot és nyissa meg a localhost:8088-at. MIT licenc alatt kiadva.