Tło stojące za Deepseek ujawnia, że plany stworzenia były mądrzejsze niż ludzie
Ilościowe tło hedgingowe Wysoka flyerktóry za pojawieniem się Deepseekzbudował portfolio 100 miliardów juanów (13,79 miliarda dolarów) przy użyciu modeli sztucznej inteligencji do podejmowania decyzji inwestycyjnych, ale do 2023 r. Postanowił zmienić kurs, aby skoncentrować się na rozwoju najbardziej zaawansowanej AI.
W publikacji na swoim oficjalnym koncie WeChat, Hangzhou Huanfang Technology Ltd Co. – Jak oficjalnie nazywa się firma – powiedziała, że skupia się na poszukiwaniu ogólnej sztucznej inteligencji (AGI).
„High-Flyer skoncentruje swoje zasoby i siłę, całkowicie poświęci się obsłudze technologii AI, która przynosi korzyści całej ludzkości, stworzy nową niezależną grupę badawczą i zbada esencję wieku”-powiedziała firma.
Openai, wspierany przez Microsoft, który opracował CHATGPT, definiuje AG jako systemy autonomiczne, które przewyższają ludzi w najbardziej cennych ekonomicznych zadaniach.
Jest to następna generacja modeli AI, a w ubiegłym tygodniu na X Post, dyrektor generalny Openai, Sam Altman, powiedział, że jego firma jeszcze nie osiągnęła tego kamienia milowego.
Deepseek
Niezależną grupą badawczą planowaną przez High-Flyer była Deepseek, której modele wstrząsnęły globalnym przemysłem technologicznym w ostatnich tygodniach. Założyciel i akcjonariusz High-Flyer jest również dyskretnym liderem.
Kontynuuje się po reklamie
Wyrafinowanie modeli Deepsek było szeroko chwalone przez jego konkurentów z Doliny Krzemowej, nowość dla chińskiego modelu AI, ale zarzuty startupu, które wykorzystały ułamek energii obliczeniowej wdrożonej przez główne amerykańskie firmy dla własnych modeli, wywołały likwidację działań technologicznych na całym świecie.
Nie jest jasne, jak blisko Deepseek rozwija model wiekowy.
Chociaż wydaje się, że sukces Deepseeka miał miejsce prawie z dnia na dzień, wysoko flyer pokazuje, jak ten wzrost meteoryczny trwał ponad dekadę.
Kontynuuje się po reklamie
Pod przywództwem Liang, fundusz spędził lata studiując i eksperymentując z modelami AI za granicą, stosując tę technologię do swojej działalności i inwestując dziesiątki milionów dolarów w najnowocześniejsze układy NVIDIA, aby zapewnić niezbędną moc komputerową do wspierania tej strategii skoncentrowanej na AI, zgodnie do analizy przeprowadzonej przez Reuters witryn o wysokiej flyer i oficjalnych kont WeChat.
Klastry superkomputerowe
Strategia obejmuje budowę dwóch klastrów superkomputerowych AI, złożonych w całości przez potężne układy Nvidia A100, których eksport do Chin został zakazany przez Waszyngton we wrześniu 2022 r.
Klastry o wysokiej flyerach zostały zbudowane i uruchomione na długo przed ogłoszeniem kontroli eksportu. Pierwszy klaster, składający się z 1100 układów A100, kosztował 200 milionów juanów i został uruchomiony w 2020 r., Podczas gdy druga, składająca się z około 10 000 żetonów A100, została ukończona rok później kosztem 1 miliarda juanów, według Według Witryna firmy i kilka postów na temat WeChat.
Kontynuuje się po reklamie
W 2022 r. Naukowcy z wysokim flyeriem mieli strategię na konferencji NVIDIA, którą firma opracowała, aby zmaksymalizować wydajność drugiego klastra podczas szkolenia modeli AI.
Mgławica
Nie jest jasne, w jaki sposób High-Flyer zainwestował w Deepseek. High-Flyer ma biuro zlokalizowane w tym samym budynku Deepsek i ma patenty związane z używanymi klastrami chipów do szkolenia modeli AI.
Liang ma 55% udziałów w wysokiej flyer, zamkniętym kapitału i posiada 99% praw do głosowania, zgodnie z chińskimi aktami korporacyjnymi. Pozostałe działania są zatrzymywane przez innych dyrektorów funduszu.
Kontynuuje się po reklamie
Do tej pory Deepseek twierdził, że używa tylko układów NVIDIA H800 i H20 do wyszkolenia swojego modelu Deepseek-V3 i jego poprzednika Deepseek-V2, który wywołał wojnę cenową AI w Chinach w Chinach, kiedy został wydany w maju.
Jednak niektórzy dyrektorzy technologii publicznie stwierdzili, że Deepseek ma do dyspozycji znacznie większą moc obliczeniową.
Skala AI, Alexandr Wang, powiedział podczas wywiadu z CNBC W czwartek, bez dowodów, Deepseek ma 50 000 układów Nvidia H100, które, jak twierdził, nie został zwolniony, ponieważ naruszyłby kontrolę eksportu Waszyngtonu. Stany Zjednoczone zabraniały eksportu układów H100 do Chin podczas zawetowania mniej potężnego A100.
Deepseek nie odpowiedział na prośbę o komentarz Reuters O roszczeniu. Nvidia również nie odpowiedziała natychmiast na e -mail z prośbą o komentarz.
Jednak troska Liang o władzę komputerową, omawiając przyszłość Deepsek, przypomina ogromną inwestycję funduszu ilościowego w klastrach AI. Zapytany w wywiadzie dla chińskich fal w lipcu ubiegłego roku, czy High-Flyer planuje oddzielić Deepeek od firmy i upublicznić, Liang odpowiedział:
„Nie planujemy zbierać pieniędzy w krótkim okresie. Problemem, z którym się borykaliśmy, nie były pieniądze, ale krawędź najnowocześniejszych wiórów. ”