Тема: Още извънтемие (Прочетена 496937 пъти)

4096bits · « **Отговор #1500 -:** Jul 19, 2024, 10:05 »

Някой ще препоръча ли свестен speech-to-text софтуер?

За терминала или графичен, не ме интересува, само да работи коректно.

Не ми се пишат скриптове и дърпат модели, че нещо не съм си организирал пространството и нямам място.

PaperNick · « **Отговор #1501 -:** Jul 19, 2024, 11:26 »

Whisper имат читави модели с различни размери, от 77MB - ggml-tiny, до 3.1 GB - ggml-large. Можеш да пробваш с ggml-small - 488MB, ако имаш повечко място ggml-medium 1.53 GB.

Георги Герганов има проект whisper.cpp от който можеш да си го пуснеш:
https://github.com/ggerganov/whisper.cpp

От тук можеш да си свалиш моделите:
https://huggingface.co/ggerganov/whisper.cpp/tree/main
https://github.com/ggerganov/whisper.cpp/blob/master/models/README.md

Преди време си бях написал един прост скрипт, който почва да преобразува към текст без да го интересува формата на файла (щото модела иска wav файлове):
https://gist.github.com/PaperNick/3a6fe78662ea7a1c7cc5c573db348ac1

4096bits · « **Отговор #1502 -:** Jul 19, 2024, 13:59 »

Благодаря!

Ще ги погледна.
Мога да отделя някъде към пет гигабайта дисково пространство. Може да се окаже недостатъчно, защото искам три езика да ползвам, та... май ще е проблем.

Без да отделя време и да си разчистя домашната директория и дяловете, май няма да се получи.

Английското ми произношение сигурно е ужасно. Не съм говорил от доста години.

И тогава не беше много добре.
Дано ме разбере това нещо.

Това ми хареса: https://github.com/ggerganov/whisper.cpp?tab=readme-ov-file#word-level-timestamp-experimental

PaperNick · « **Отговор #1503 -:** Jul 19, 2024, 14:16 »

Цитат на: 4096bits в Jul 19, 2024, 13:59

Мога да отделя някъде към пет гигабайта дисково пространство. Може да се окаже недостатъчно, защото искам три езика да ползвам, та... май ще е проблем.

Мисля, че ще е напълно достатъчно, понеже линуксите си идват със стандартните runtimes за c++. Реално единствено модела ще заеме най-много място. В такъв случай пробвай с medium модела 1.5 GB.

Цитат на: 4096bits в Jul 19, 2024, 13:59

Английското ми произношение сигурно е ужасно. Не съм говорил от доста години.

Всякакъв акцент лови, толкова е добро, че направо ще те шашне (поне за английски де)

Може и real-time, но не съм го пробвал: https://github.com/ggerganov/whisper.cpp?tab=readme-ov-file#real-time-audio-input-example

Nik123 · « **Отговор #1504 -:** Jul 19, 2024, 15:46 »

https://www.bbc.com/news/articles/cp4wnrxqlewo

Какво се е случило всъщност, майкрософтците ли са се издънили, или антивируса?

4096bits · « **Отговор #1505 -:** Jul 19, 2024, 18:42 »

Цитат на: Nik123 в Jul 19, 2024, 15:46

https://www.bbc.com/news/articles/cp4wnrxqlewo

Какво се е случило всъщност, майкрософтците ли са се издънили, или антивируса?

Бъгав софтуер на някаква компания е причинил срив но системите. Или бъгавата система се е сринала заради софтуера на компанията. Или бъгавата система се е сринала зради бъгавия софтуер на компанията.

И понеже явно доста им се ползва нещото, ето ти резултата.

Acho · « **Отговор #1506 -:** Jul 19, 2024, 19:37 »

Паднали са им акцийките на тая компания и на Микрософта, а и няколко авиокомпании са имали големи проблеми със системите им, и са канселирали доста полети.

remotexx · « **Отговор #1507 -:** Jul 20, 2024, 03:13 »

А бе... лоша реклама няма
https://www.msn.com/en-us/news/technology/who-s-vincent-flibustier-the-fake-crowdstrike-employee-and-viral-twitter-hoax-about-the-microsoft-outage-explained/ar-BB1qihAC

А QA екипа остава на работа
https://x.com/vinceflibustier/status/1814277507396296828

https://img-s-msn-com.akamaized.net/tenant/amp/entityid/BB1qif7f.img

remotexx · « **Отговор #1508 -:** Jul 20, 2024, 07:23 »

а за който му е интересно в подробности
https://x.com/Perpetualmaniac/status/1814376668095754753
It was our beloved NULL pointer error at fault

П.П. между другото - от същия тип, според когото... AI super intelligence by 2027.
https://x.com/Perpetualmaniac

Google Whistleblower via James O'Keefe . Disclosed Google's "Machine Learning Fairness", the AI system that censors and controls your access to information.

да видим дали ще успее да осъди Гугъля
https://x.com/Perpetualmaniac/status/1798859859380834320

https://www.zachvorhies.com
The goal of this website is to expose how Google's algorithms work to censor you, and how they distort search results. The hope is that by exposing it we can stop Google from seizing power.

Остава само да разберем кога Гугъля ще се прекръстят на Скайнет...

4096bits · « **Отговор #1509 -:** Jul 20, 2024, 12:05 »

Цитат на: PaperNick в Jul 19, 2024, 11:26

Whisper имат читави модели с различни размери, от 77MB - ggml-tiny, до 3.1 GB - ggml-large. Можеш да пробваш с ggml-small - 488MB, ако имаш повечко място ggml-medium 1.53 GB.

Георги Герганов има проект whisper.cpp от който можеш да си го пуснеш:
https://github.com/ggerganov/whisper.cpp

От тук можеш да си свалиш моделите:
https://huggingface.co/ggerganov/whisper.cpp/tree/main
https://github.com/ggerganov/whisper.cpp/blob/master/models/README.md

Преди време си бях написал един прост скрипт, който почва да преобразува към текст без да го интересува формата на файла (щото модела иска wav файлове):
https://gist.github.com/PaperNick/3a6fe78662ea7a1c7cc5c573db348ac1

Така, за по-просто и за опит, инсталирах първо whisper.
Дръпна една камара библиотеки в процеса.

При първата проба с десет минутно аудио, само̀ си дръпна модела, който му бях посочил, което е дребно и хубаво удобство - medium. Гигабайт и половина.

Но не се получи почти нищо. Имаше някакъв обещаващ старт, но… По някое време целия дисплей замръзва, а аз нищо не мога да направя. Графичната карта е на сто процента натоварена и може би целия ресурс отива за изпълнението на задачката ( което ми хрумна като възможна причина едва сега, докато пиша това ).
Пробвах след това през tty.
Същата работа. Конзолата замръзва и до там. Дали работи нещо отдолу, нямам представа. Никакви странични съобщения.

Графичната ми карта е едва с 6 гига памет, а този модел изисква 5. Би трябвало да стане. На теория.

Опитът със small модел свърши работа в tty. Не съм го пробвал с терминал в графичната среда.

Смахнатото е, че имам 32 гига RAM на лаптопа, която изглежда не учавстваше много. Видях, че май може да се зададе устройство, което да се използва ( например CPU ), но още не съм пробвал. Сигурно ще стане и по-бавно така. Но тази памет поне би влязла в употреба.

Small моделът свърши учудващо добра работа, предвид че в речта на моменти бяха изяждани или сдъвкани звуци - английски акцент. Ползвах аудио, рипнато от видео в Тубата.

Пробвах първо оригиналния whisper, защото изобщо не съм се занимавал до този момент с ИИ.
Видях, че има различни файлови разширения за моделите.

С++ версията на @ggerganov изцяло на този език ли е, ще върви ли по-леко, в същата папка ли трябва да поставя дръпнатите модели ( ~/.cache/whisper ), ако реша да пробвам и това. Защото сигурно ще го направя. Човека е дал достатъчно инструкции, как се инсталира.
Защото искам да пробвам и medium, а защо не и големия модел, ако ми позволи да използвам наличната памет, а не само видео паметта. Тя е недостатъчна за големия модел, а и със средния не се получава засега. Да видя, каква е разликата в точността на текста.

Изглежда си си играл с whisperC++?, а не изключвам и да си самият @ggerganov, но поради някаква причина да говориш за себе с в трето лице

Nik123 · « **Отговор #1510 -:** Jul 20, 2024, 20:54 »

Айде наш'те!

https://www.moreto.net/novini.php?n=498742

spec1a · « **Отговор #1511 -:** Jul 21, 2024, 09:15 »

Западните мастии се насраха,в Русия обаче всичко е наред:

Глобалния срив на Windows не засегна Русия

Росавиация заяви, че руските летища и авиокомпании работят нормално и полетите се изпълняват по разписание

https://www.kaldata.com/it-%d0%bd%d0%be%d0%b2%d0%b8%d0%bd%d0%b8/%d0%b2%d1%87%d0%b5%d1%80%d0%b0%d1%88%d0%bd%d0%b8%d1%8f%d1%82-%d0%b3%d0%bb%d0%be%d0%b1%d0%b0%d0%bb%d0%b5%d0%bd-%d1%81%d1%80%d0%b8%d0%b2-%d0%bd%d0%b0-windows-%d0%bd%d0%b5-%d0%b7%d0%b0%d1%81%d0%b5%d0%b3-497558.html

Просто руснаците си имат Линукс базирана държавна ОС,и явно
работи добре,без бози и без малоумни "антивирусни" ...

spec1a · « **Отговор #1512 -:** Jul 21, 2024, 09:19 »

Те това вече е култово !

Ето това е ценен съвет: Microsoft заяви, че са необходими 15 рестартирания на Windows за спасяване на пострадалите системи

https://www.kaldata.com/it-%d0%bd%d0%be%d0%b2%d0%b8%d0%bd%d0%b8/%d0%b5%d1%82%d0%be-%d1%82%d0%be%d0%b2%d0%b0-%d0%b5-%d1%86%d0%b5%d0%bd%d0%b5%d0%bd-%d1%81%d1%8a%d0%b2%d0%b5%d1%82-microsoft-%d0%b7%d0%b0%d1%8f%d0%b2%d0%b8-%d1%87%d0%b5-%d1%81%d0%b0-%d0%bd%d0%b5%d0%be-497555.html

Acho · « **Отговор #1513 -:** Jul 21, 2024, 10:25 »

То на тия и 20 ребоота са им малко.

Acho · « **Отговор #1514 -:** Jul 21, 2024, 10:52 »

И къде го видяха за днеска туй "захлаждане и превалявания в различни региони" ? Засега си е баш лятна жега деа.

Автор Тема: Още извънтемие (Прочетена 496937 пъти)

4096bits

Re: Още извънтемие

PaperNick

Re: Още извънтемие

4096bits

Re: Още извънтемие

PaperNick

Re: Още извънтемие

Nik123

Re: Още извънтемие

4096bits

Re: Още извънтемие

Acho

Re: Още извънтемие

remotexx

Re: Още извънтемие

remotexx

Re: Още извънтемие

4096bits

Re: Още извънтемие

Nik123

Re: Още извънтемие

spec1a

Re: Още извънтемие

spec1a

Re: Още извънтемие

Acho

Re: Още извънтемие

Acho

Re: Още извънтемие