szymonlukasik

48 posts

szymonlukasik

szymonlukasik

@szymonluk

Data enthusiast, family man

Katılım Şubat 2019
76 Takip Edilen39 Takipçiler
Remek Kinas
Remek Kinas@KinasRemek·
Sesja posterowa na konferencji ICLR 2026 … zrobimy coś takiego w Polsce? 🇵🇱 Piotr @piotrsankowski
Polski
4
1
34
5.1K
szymonlukasik
szymonlukasik@szymonluk·
@niedakhPL You really think gigachat is at gpt4 level? Have you seen some evaluations?
English
1
0
0
25
szymonlukasik
szymonlukasik@szymonluk·
@KinasRemek Możecie/Mozemy się zgłosić na grant na LUMI. Problem jest w danych… Biliony (angielskie trilliony) czystych tokenów potrzebne…
Polski
0
0
0
177
Remek Kinas
Remek Kinas@KinasRemek·
Rozumiem, po wczorajszym Prima Aprilis, że przydałby się Bielik 🦅 30B i 120B MoE? Jesteśmy gotowi zrobić nawet 300B tylko trzeba znaleźć moc (w sensie GPU lub $$$ na trening). To już nie jest 11B gdzie możemy wejść w jakiś wolny slocik …
Polski
33
3
146
13.5K
szymonlukasik
szymonlukasik@szymonluk·
@CKeruac Popieram, zresztą to nie nowy postulat - James Bezdek, 1994. Ale nie przejdzie w kulturze buzz word’ów
Polski
0
0
1
34
Christopher Keruac
Christopher Keruac@CKeruac·
Zgadzam się z Horvitzem. Najwyższy czas przestać mówić o "Sztucznej Inteligencji", a zacząć o "Inteligencji obliczeniowej". Słowo "sztuczna" nadało tym modelom aurę magii i sci-fi, przez co ludzie zaczęli w nich widzieć nowe formy życia. Tymczasem "obliczeniowa" sprowadza rzecz na ziemię - do poziomu twardej matematyki i fizyki. To właśnie dlatego ludzie zawsze pozostaną na górze: bo maszyna może optymalizować obliczenia lepiej od nas, ale to nasz, ucieleśniony mózg nadaje im jakikolwiek cel.
Haider.@haider1

Microsoft Chief Scientific Officer Eric Horvitz: The term artificial intelligence is wrong; it should be computational intelligence because it applies to both biological and machine systems. Humans will stay on top, guiding with our values and goals, even as machines shape us

Polski
14
5
74
5.4K
Karolina Zioło-Pużuk
Karolina Zioło-Pużuk@KarolinaZioloP·
W @MNiSW_GOV__PL analizujemy, sprawdzamy, robimy symulacje. Raz jeszcze sprawdziliśmy uwagi do rozporządzenia, przeanalizowaliśmy wraz z uwagami z dyskusji po publikacjach medialnych (dziękuję @KatMokrzycka @AlicjaGardulska @ForumAkad za opisanie szczegółowo spraw dotyczących czasopism i ewaluacji) i postanowiliśmy wrócić do poprzedniej oceny konferencji IT, gdzie najważniejsze z nich mają miarę 200 punktów.
Polski
34
6
81
24.9K
szymonlukasik retweetledi
NASK
NASK@NASK_pl·
#Poland 🇵🇱 and #Korea 🇰🇷 are teaming up for #AI safety! 🤝 NASK and the Korea AI Safety Institute (#ETRI) will collaborate on research, standards, training, and protection against risks like deepfakes. More: nask.pl/aktualnosci/po…
NASK tweet media
English
0
1
4
614
Sebastian
Sebastian@SebKondracki·
Bielik v3 w benchmarkach EuroEval 🧱 Model bazowy - 4. miejsce w zadaniach wielojęzycznych. 💬 Model instrukcyjny - 32. miejsce w zadaniach wielojęzycznych. Top 10 to giganci i modele wielokrotnie większe niż nasze 11B. A mimo to wyprzedzamy Nemotron 30B, OLMo 32B i Llama 3.1 8B. Polski open source. Społeczność. Wynik. 🇵🇱 Brawo! @KinasRemek @ChrisOciepa @kwrobel_eth Adrian Łukasz i @Cyfronet. @CYFRA_GOV_PL takie wyniki aż proszą się o symboliczne docenienie zespołu trenującego 🙂 choćby order, dyplom albo kawa ☕️
Sebastian tweet media
Polski
17
51
540
22.4K
szymonlukasik
szymonlukasik@szymonluk·
@InfZakladowy Większość LLMow ma filtry jakości scrapowanych danych - z polskiego podwórka ma je i PLLuM i Bielik…
Polski
0
0
1
39
Informatyk Zakładowy
Informatyk Zakładowy@InfZakladowy·
Mój serwis Monitor SLPS (slps.pl) odnotował dziesięć milionów odsłon w ciągu jednego tygodnia. Jak to możliwe? Ano, firmy produkujące LLM-y ignorują polecenia pliku robots.txt i pożerają wszystko bez opamiętania. Na przykład 15 milionów raportów z losowań, hej!
Informatyk Zakładowy tweet media
Polski
24
12
348
76K
Alice in Weights
Alice in Weights@AliceInWeights·
@SebKondracki Skuteczność porównywalna do mniejszej gemma-3n-E4B-it, która nie optymalizowała się pod ten benchmark.
Polski
1
0
5
935
Sebastian
Sebastian@SebKondracki·
AI Act w praktyce wygląda tak, że w @bielikllm sprawdzamy dla każdej strony plik robots.txt, tagi TDM (Text and Data Mining) oraz regulamin - czy nie ma opt-out. Reszta świata pobiera wszystko, "bo może się przyda". No i jak w takich warunkach robić dobre modele?
Informatyk Zakładowy@InfZakladowy

Mój serwis Monitor SLPS (slps.pl) odnotował dziesięć milionów odsłon w ciągu jednego tygodnia. Jak to możliwe? Ano, firmy produkujące LLM-y ignorują polecenia pliku robots.txt i pożerają wszystko bez opamiętania. Na przykład 15 milionów raportów z losowań, hej!

Polski
18
14
309
32.3K
szymonlukasik
szymonlukasik@szymonluk·
Polski językiem AI? Jeśli ktoś z Was natrafił na ten chwytliwy tytuł to polecam tekst w którym staram się przebić ten mocno napompowany balonik. @"Polski językiem AI? "linkedin.com/pulse/polski-j… on @LinkedIn
Polski
0
0
0
24
szymonlukasik
szymonlukasik@szymonluk·
@sjanus_pl Cloudferro już od dawna oferuje i Bielika i PLLuMa po API…
Polski
0
0
2
213
Szymon Janus
Szymon Janus@sjanus_pl·
Dobra wiadomości. Beyond - operator "serwerowni", należący do Kulczyka, zapowiedział właśnie stworzenie Fabryki AI, opartej na polskim modelu Bielik. Będą oferowali możliwość korzystania z Bielika w swoich projektach, na bazie "hostingu" przez Beyond. Ma być ~40% taniej niż u zagranicznej konkurencji. To bardzo dobra informacja, zgodna z tym co kiedyś postulowałem ;) Bielik musi mieć wsparcie dla firm w integracji i supporcie i to się właśnie dzieje. Gdzieś mi też mignęło, że powstała firma twórców Bielika, oferująca właśnie usługi w integracji. Coraz lepsze perspektywy przed Bielikiem. Czekam jeszcze na @InPostPL i @RBrzoska z ogłoszeniem współpracy z Bielikiem ;)
GIF
Polski
21
35
506
28.7K
szymonlukasik
szymonlukasik@szymonluk·
@m_b_lewkowicz @TrajektoriaAI @UODOgov_pl Zaczyna się to o czym intensywnie ostrzegaliśmy przy okazji każdego wystąpienia o deep fake’ach w ramach działalności Ośrodka Badań nad Bezpieczeństwem @NASK_pl. To bodaj nastraszniejsze społecznie użycie technologii deep fake
Polski
1
2
7
938
Monika Blandyna Lewkowicz
Monika Blandyna Lewkowicz@m_b_lewkowicz·
🚫 @UODOgov_pl zawiadomił policję ws. uczniów podstawówki, którzy wygenerowali deepnude koleżanki poniżej 15 r.ż. i zachęcali na Instagramie do szerowania. To podpada pod kk ws. pornografii dziecięcej! Przypominam mój tekst z radami dla ofiar deepnude, ich rodziców, przyjaciół ⤵️
Polski
2
4
18
2.9K
NASK
NASK@NASK_pl·
Karolina Seweryn, ekspertka NASK na #WomenInTech @perspektywy_s: Staramy się, aby w polskich modelach, takich jak @PLLuM_pl, były obecne feminatywy. Język polski jest dużym wyzwaniem dla #AI. Pokazały to badania: jeżeli modelom anglocentrycznym zadamy pytanie w języku angielskim, to modele odpowiedzą niestereotypwo. Natomiast to samo pytanie zadane w języku polskim jest już nacechowane stereotypowo.
NASK tweet media
Polski
126
12
22
40.6K
Tomasz Rychter
Tomasz Rychter@TomaszRychter·
A jednak PLLuM został urzędasem (nie mylić z urzędnikiem) szybciej niż się spodziewałem:
Tomasz Rychter tweet media
Polski
3
0
9
558
szymonlukasik
szymonlukasik@szymonluk·
Dużo mówi się ostatnio o modelu Deepseek, pojawiły się oskarżenia, że za jego sukces częściowo odpowiada destylacja modeli innych firm. Wszystkim zainteresowanych tym tematem polecam ciekawy wpis na blogu technicznym projektu PLLuM pllum.org.pl/blog/posts/two…
Polski
2
2
17
3.3K