Автор Тема: Още извънтемие  (Прочетена 121728 пъти)

4096bits

  • Напреднали
  • *****
  • Публикации: 6891
    • Профил
Re: Още извънтемие
« Отговор #1500 -: Jul 19, 2024, 10:05 »
Някой ще препоръча ли свестен speech-to-text софтуер?

За терминала или графичен, не ме интересува, само да работи коректно.

Не ми се пишат скриптове и дърпат модели, че нещо не съм си организирал пространството и нямам място.
Активен

As they say in Mexico, "Dasvidaniya!" Down there, that's two vidaniyas.

PaperNick

  • Напреднали
  • *****
  • Публикации: 295
  • Window Manager: Xfce
    • Профил
Re: Още извънтемие
« Отговор #1501 -: Jul 19, 2024, 11:26 »
Whisper имат читави модели с различни размери, от 77MB - ggml-tiny, до 3.1 GB - ggml-large. Можеш да пробваш с ggml-small - 488MB, ако имаш повечко място ggml-medium 1.53 GB.

Георги Герганов има проект whisper.cpp от който можеш да си го пуснеш:
https://github.com/ggerganov/whisper.cpp

От тук можеш да си свалиш моделите:
https://huggingface.co/ggerganov/whisper.cpp/tree/main
https://github.com/ggerganov/whisper.cpp/blob/master/models/README.md

Преди време си бях написал един прост скрипт, който почва да преобразува към текст без да го интересува формата на файла (щото модела иска wav файлове):
https://gist.github.com/PaperNick/3a6fe78662ea7a1c7cc5c573db348ac1
Активен

Practice

4096bits

  • Напреднали
  • *****
  • Публикации: 6891
    • Профил
Re: Още извънтемие
« Отговор #1502 -: Jul 19, 2024, 13:59 »
Благодаря!

Ще ги погледна.
Мога да отделя някъде към пет гигабайта дисково пространство. Може да се окаже недостатъчно, защото искам три езика да ползвам, та... май ще е проблем.

Без да отделя време и да си разчистя домашната директория и дяловете, май няма да се получи.

Английското ми произношение сигурно е ужасно. Не съм говорил от доста години.  ;D
И тогава не беше много добре.
Дано ме разбере това нещо.

Това ми хареса: https://github.com/ggerganov/whisper.cpp?tab=readme-ov-file#word-level-timestamp-experimental
« Последна редакция: Jul 19, 2024, 14:05 от 4096bits »
Активен

As they say in Mexico, "Dasvidaniya!" Down there, that's two vidaniyas.

PaperNick

  • Напреднали
  • *****
  • Публикации: 295
  • Window Manager: Xfce
    • Профил
Re: Още извънтемие
« Отговор #1503 -: Jul 19, 2024, 14:16 »
Мога да отделя някъде към пет гигабайта дисково пространство. Може да се окаже недостатъчно, защото искам три езика да ползвам, та... май ще е проблем.

Мисля, че ще е напълно достатъчно, понеже линуксите си идват със стандартните runtimes за c++. Реално единствено модела ще заеме най-много място. В такъв случай пробвай с medium модела 1.5 GB.

Английското ми произношение сигурно е ужасно. Не съм говорил от доста години.  ;D

Всякакъв акцент лови, толкова е добро, че направо ще те шашне (поне за английски де)

Може и real-time, но не съм го пробвал: https://github.com/ggerganov/whisper.cpp?tab=readme-ov-file#real-time-audio-input-example
Активен

Practice

Nik123

  • Напреднали
  • *****
  • Публикации: 3729
  • Distribution: Mageia, Q4OS
    • Профил
Re: Още извънтемие
« Отговор #1504 -: Jul 19, 2024, 15:46 »
https://www.bbc.com/news/articles/cp4wnrxqlewo

Какво се е случило всъщност, майкрософтците ли са се издънили, или антивируса?
Активен

4096bits

  • Напреднали
  • *****
  • Публикации: 6891
    • Профил
Re: Още извънтемие
« Отговор #1505 -: Jul 19, 2024, 18:42 »
https://www.bbc.com/news/articles/cp4wnrxqlewo

Какво се е случило всъщност, майкрософтците ли са се издънили, или антивируса?
Бъгав софтуер на някаква компания е причинил срив но системите. Или бъгавата система се е сринала заради софтуера на компанията. Или бъгавата система се е сринала зради бъгавия софтуер на компанията.

И понеже явно доста им се ползва нещото, ето ти резултата.
Активен

As they say in Mexico, "Dasvidaniya!" Down there, that's two vidaniyas.

Acho

  • Напреднали
  • *****
  • Публикации: 5933
  • Distribution: Slackware, MikroTik - сървърно
  • Window Manager: console only
    • Профил
    • WWW
Re: Още извънтемие
« Отговор #1506 -: Jul 19, 2024, 19:37 »
Паднали са им акцийките на тая компания и на Микрософта, а и няколко авиокомпании са имали големи проблеми със системите им, и са канселирали доста полети.
Активен

CPU - Intel Quad-Core Q8400, 2.66 GHz; Fan - Intel Box; MB - Intel G41M-T2; RAM - DDR2-800, Kingston HyperX, 2X2048 MB; VC - onboard, Intel G41 Express Chipset; HDD - Toshiba, 500 GB, SATAII; SB - Realtek HD Audio; DVD-RW - TSSTcorp DVD-RW; LAN - Realtek PCI-E GBE Controller; PSU - Fortron 400 Watt.

remotexx

  • Напреднали
  • *****
  • Публикации: 3764
    • Профил
« Последна редакция: Jul 20, 2024, 03:26 от remotexx »
Активен

remotexx

  • Напреднали
  • *****
  • Публикации: 3764
    • Профил
Re: Още извънтемие
« Отговор #1508 -: Jul 20, 2024, 07:23 »
а за който му е интересно в подробности
https://x.com/Perpetualmaniac/status/1814376668095754753
It was our beloved NULL pointer error at fault


П.П. между другото - от същия тип, според когото... AI super intelligence by 2027.
https://x.com/Perpetualmaniac

Google Whistleblower via James O'Keefe . Disclosed Google's "Machine Learning Fairness", the AI system that censors and controls your access to information.

да видим дали ще успее да осъди Гугъля
https://x.com/Perpetualmaniac/status/1798859859380834320


https://www.zachvorhies.com
The goal of this website is to expose how Google's algorithms work to censor you, and how they distort search results. The hope is that by exposing it we can stop Google from seizing power.

Остава само да разберем кога Гугъля ще се прекръстят на Скайнет...
« Последна редакция: Jul 20, 2024, 07:38 от remotexx »
Активен

4096bits

  • Напреднали
  • *****
  • Публикации: 6891
    • Профил
Re: Още извънтемие
« Отговор #1509 -: Jul 20, 2024, 12:05 »
Whisper имат читави модели с различни размери, от 77MB - ggml-tiny, до 3.1 GB - ggml-large. Можеш да пробваш с ggml-small - 488MB, ако имаш повечко място ggml-medium 1.53 GB.

Георги Герганов има проект whisper.cpp от който можеш да си го пуснеш:
https://github.com/ggerganov/whisper.cpp

От тук можеш да си свалиш моделите:
https://huggingface.co/ggerganov/whisper.cpp/tree/main
https://github.com/ggerganov/whisper.cpp/blob/master/models/README.md

Преди време си бях написал един прост скрипт, който почва да преобразува към текст без да го интересува формата на файла (щото модела иска wav файлове):
https://gist.github.com/PaperNick/3a6fe78662ea7a1c7cc5c573db348ac1
Така, за по-просто и за опит, инсталирах първо whisper.
Дръпна една камара библиотеки в процеса.

При първата проба с десет минутно аудио, само̀ си дръпна модела, който му бях посочил, което е дребно и хубаво удобство - medium. Гигабайт и половина.

Но не се получи почти нищо. Имаше някакъв обещаващ старт, но… По някое време целия дисплей замръзва, а аз нищо не мога да направя. Графичната карта е на сто процента натоварена и може би целия ресурс отива за изпълнението на задачката ( което ми хрумна като възможна причина едва сега, докато пиша това ).
Пробвах след това през tty.
Същата работа. Конзолата замръзва и до там. Дали работи нещо отдолу, нямам представа. Никакви странични съобщения.

Графичната ми карта е едва с 6 гига памет, а този модел изисква 5. Би трябвало да стане. На теория.

Опитът със small модел свърши работа в tty. Не съм го пробвал с терминал в графичната среда.

Смахнатото е, че имам 32 гига RAM на лаптопа, която изглежда не учавстваше много. Видях, че май може да се зададе устройство, което да се използва ( например CPU ), но още не съм пробвал. Сигурно ще стане и по-бавно така. Но тази памет поне би влязла в употреба.

Small моделът свърши учудващо добра работа, предвид че в речта на моменти бяха изяждани или сдъвкани звуци - английски акцент. Ползвах аудио, рипнато от видео в Тубата.

Пробвах първо оригиналния whisper, защото изобщо не съм се занимавал до този момент с ИИ.
Видях, че има различни файлови разширения за моделите.

С++ версията на @ggerganov изцяло на този език ли е, ще върви ли по-леко, в същата папка ли трябва да поставя дръпнатите модели ( ~/.cache/whisper ), ако реша да пробвам и това. Защото сигурно ще го направя. Човека е дал достатъчно инструкции, как се инсталира.
Защото искам да пробвам и medium, а защо не и големия модел, ако ми позволи да използвам наличната памет, а не само видео паметта. Тя е недостатъчна за големия модел, а и със средния не се получава засега. Да видя, каква е разликата в точността на текста.

Изглежда си си играл с whisperC++?, а не изключвам и да си самият @ggerganov, но поради някаква причина да говориш за себе с в трето лице  :D
« Последна редакция: Jul 20, 2024, 12:09 от 4096bits »
Активен

As they say in Mexico, "Dasvidaniya!" Down there, that's two vidaniyas.

Nik123

  • Напреднали
  • *****
  • Публикации: 3729
  • Distribution: Mageia, Q4OS
    • Профил
Re: Още извънтемие
« Отговор #1510 -: Jul 20, 2024, 20:54 »
Айде наш'те!

https://www.moreto.net/novini.php?n=498742

 [_]3
Активен

spec1a

  • Напреднали
  • *****
  • Публикации: 4402
    • Профил
Re: Още извънтемие
« Отговор #1511 -: Jul 21, 2024, 09:15 »
   Западните мастии се насраха,в Русия обаче всичко е наред:

Глобалния срив на Windows не засегна Русия

Росавиация заяви, че руските летища и авиокомпании работят нормално и полетите се изпълняват по разписание

https://www.kaldata.com/it-%d0%bd%d0%be%d0%b2%d0%b8%d0%bd%d0%b8/%d0%b2%d1%87%d0%b5%d1%80%d0%b0%d1%88%d0%bd%d0%b8%d1%8f%d1%82-%d0%b3%d0%bb%d0%be%d0%b1%d0%b0%d0%bb%d0%b5%d0%bd-%d1%81%d1%80%d0%b8%d0%b2-%d0%bd%d0%b0-windows-%d0%bd%d0%b5-%d0%b7%d0%b0%d1%81%d0%b5%d0%b3-497558.html



   Просто руснаците си имат Линукс базирана държавна ОС,и явно
работи добре,без бози и без малоумни "антивирусни" ...
« Последна редакция: Jul 21, 2024, 09:18 от spec1a »
Активен

spec1a

  • Напреднали
  • *****
  • Публикации: 4402
    • Профил
Re: Още извънтемие
« Отговор #1512 -: Jul 21, 2024, 09:19 »
Те това вече е култово !

Ето това е ценен съвет: Microsoft заяви, че са необходими 15 рестартирания на Windows за спасяване на пострадалите системи

https://www.kaldata.com/it-%d0%bd%d0%be%d0%b2%d0%b8%d0%bd%d0%b8/%d0%b5%d1%82%d0%be-%d1%82%d0%be%d0%b2%d0%b0-%d0%b5-%d1%86%d0%b5%d0%bd%d0%b5%d0%bd-%d1%81%d1%8a%d0%b2%d0%b5%d1%82-microsoft-%d0%b7%d0%b0%d1%8f%d0%b2%d0%b8-%d1%87%d0%b5-%d1%81%d0%b0-%d0%bd%d0%b5%d0%be-497555.html

 ;D

Активен

Acho

  • Напреднали
  • *****
  • Публикации: 5933
  • Distribution: Slackware, MikroTik - сървърно
  • Window Manager: console only
    • Профил
    • WWW
Re: Още извънтемие
« Отговор #1513 -: Jul 21, 2024, 10:25 »
То на тия и 20 ребоота са им малко.
Активен

CPU - Intel Quad-Core Q8400, 2.66 GHz; Fan - Intel Box; MB - Intel G41M-T2; RAM - DDR2-800, Kingston HyperX, 2X2048 MB; VC - onboard, Intel G41 Express Chipset; HDD - Toshiba, 500 GB, SATAII; SB - Realtek HD Audio; DVD-RW - TSSTcorp DVD-RW; LAN - Realtek PCI-E GBE Controller; PSU - Fortron 400 Watt.

Acho

  • Напреднали
  • *****
  • Публикации: 5933
  • Distribution: Slackware, MikroTik - сървърно
  • Window Manager: console only
    • Профил
    • WWW
Re: Още извънтемие
« Отговор #1514 -: Jul 21, 2024, 10:52 »
И къде го видяха за днеска туй "захлаждане и превалявания в различни региони" ? Засега си е баш лятна жега деа.
Активен

CPU - Intel Quad-Core Q8400, 2.66 GHz; Fan - Intel Box; MB - Intel G41M-T2; RAM - DDR2-800, Kingston HyperX, 2X2048 MB; VC - onboard, Intel G41 Express Chipset; HDD - Toshiba, 500 GB, SATAII; SB - Realtek HD Audio; DVD-RW - TSSTcorp DVD-RW; LAN - Realtek PCI-E GBE Controller; PSU - Fortron 400 Watt.