DeepSeek разкрива методи за намаляване на разходите за обучение на голям модел V3 в нов документ · TechNode
DeepSeek пусна нов хартиясъс съоснователя Liang Wenfeng, посочен като сътрудник, описвайки как неговият най-нов голям езиков модел DeepSeek-V3 постига ефективно обучение и изводи, използвайки само 2048 H800 GPU – значително…