Dlaczego Deepseek jest postrzegany jako „błąd”?

Bogdan29.01.2025

Liselotte Sabroe Dania / EPA

Chińskie Strartup Deepseek wstrząsnął amerykańską gospodarką, wprowadzając nowy model sztucznej inteligencji (AI), który konkuruje z najlepszymi modelami amerykańskimi. „A teraz?”

W ciągu ostatnich dwóch lat modele AI firm takich jak Openai, Google i cel stały się w stanie wykonywać coraz bardziej złożone zadania. Aby to osiągnąć, firmy technologiczne wydały dziesiątki tysięcy milionów rozwoju AI.

Ale bez (najwyraźniej) nic do przewidzenia, 20 stycznia, chińskiego startupu Deepseek Dostępny model R1 opublikował artykuł, który pokazuje imponującą wydajność AI E.

Model Deepseek wykonał porównywalny z modelem 01 Openai 01 w różnych testach matematycznych i kodowania. To nie byłby szok, gdybym nie był w stanie 20 do 50 razy tańsze Aby trenować i używać znacznie mniej zasobów obliczeniowych.

Ten wynalazek może pomóc większej liczbie organizacji i firm skorzystać z usług AI. Oraz fakt, że jest to open source i może swobodnie dostępny Zmuszanie nas do konkurentów do obniżenia własnych cen.

Deepseek był dość przejrzysty w publikacji swoich wyników, w testach referencyjnych. Jednak nie jest jeszcze dokładnie znane, w jakim stopniu model Deepseek porównuje się z głównymi modelami USA.

W końcu ten „błąd” może nie być tak rewolucyjny, jak się wydaje.

Jak zauważono, model ma pewien Włączone uprzedzenia w ich formacji, które mają być zgodne z ograniczeniami Rząd chińskina przykład, aby uniknąć dyskusji na temat traktowania mniejszości etnicznej Uiguur i przestrzegać linii chińskiej partii komunistycznej na temat statusu politycznego Tajwanu.

Deepseek ma dostęp do chińskich i obcokrajowców zasobów obliczeniowych przechowywanych w chmurze – które nie podlegają amerykańskim kontroli eksportu, które starały się ograniczyć wykorzystanie amerykańskich układów w Chinach. Zasoby te prawdopodobnie pomogły startupowi odkryć bardziej wydajne techniki, generując Pierwsze dane treningowe syntetyczne a następnie umożliwianie szerokiej próby i eksperymentów błędów.

Pomimo tych amerykańskich kontroli eksportu, firma miała również dostęp do Ostatnie pokolenie układów AI. Zwrócono uwagę, że Deepseek wyszkolił swoje modele AI w układach NVIDIA H800, które zostały zaprojektowane w celu obejścia starszych i mniej skutecznych kontroli eksportu w USA.

Jednakże…

„Prawdziwy test pojawia się, gdy te centra danych wymagają aktualizacji lub ekspansji – proces, który będzie łatwiejszy dla amerykańskich firm, ale trudny dla chińskich firm w ramach Kontrola eksportu w USA„, RozważaM Lennart HomeTak Row Corporation, E Sihao Huangz University of Oxford, wskazywany przez nowego naukowca.

„O moment Sputnik da ia”?

„Jeśli Deepseek nie będzie całkowicie zakłócić amerykańskiego świata AI, dlaczego amerykański rynek technologii i inwestorzy są spanikowani? – pyta nowego naukowca.

Ten sam magazyn wskazuje, że w ostatnich latach, Stworzono bańkę reklamową IA, które doprowadziły do wysokich ocen firm technologicznych; i porównuje obecny scenariusz z „Moment Sputnik” Tam, gdzie Związek Radziecki zaskoczył USA, wprowadzając pierwszego sztucznego satelity dla przestrzeni.

W takim przypadku, USA były świadome ZSRR Jeśli chodzi o technologię przestrzenną i świadomy postępów radzieckich. Tylko opinia publiczna nie była świadoma z powodu tajemnicy rządu USA.

Jest na ten moment, aby odzwierciedlić wiek Sputnik: Może to być sytuacja, w której historia sensacyjna wywołuje przesadną reakcję opinii publicznej i „ukryty”, Zachęcaj do większej liczby wydatków z AI.

Source link

add a comment

Bogdan

Cześć, nazywam się Luca i jestem autorem tej strony z przydatnymi poradami kulinarnymi. Zawsze fascynowało mnie gotowanie i kulinarne eksperymenty. Dzięki wieloletniej praktyce i nauce różnych technik gotowania zdobyłem duże doświadczenie w gotowaniu różnych potraw.

view all posts