Zhvilluesi kinez i inteligjencës artificiale, DeepSeek, ka publikuar modelin e tij më të fundit “eksperimental”.
Sipas kompanisë, ai ishte më efikas për t’u trajnuar dhe më i mirë në përpunimin e sekuencave të gjata të tekstit sesa versionet e mëparshme të modeleve të saj të mëdha gjuhësore.
Kompania me seli në Hangzhou e quajti DeepSeek-V3.2-Exp një “hap të ndërmjetëm drejt arkitekturës sonë të gjeneratës së ardhshme”.
Sipas mediave të huaja, kjo arkitekturë ka të ngjarë të jetë një nga publikimet më të rëndësishme të produktit të DeepSeek.
Modeli V3.2-Exp përfshin një mekanizëm të quajtur DeepSeek Sparse Attention, të cilin firma kineze thotë se mund të ulë kostot e informatikës dhe të rrisë performancën e disa llojeve të modeleve.
Arkitektura e gjeneratës së ardhshme e DeepSeek mund të ushtrojë presion të konsiderueshëm mbi rivalët vendas si Qwen i Alibaba-s dhe homologët amerikanë si OpenAI. /Telegrafi/
Rizvanolli: Çmimi i energjisë në Kosovë, më i ulëti në rajon
Kurti për postin e presidentit: Opozita s’i ka votat as për ...
Kurti sulmon ashpër liderët e opozitës: Katër veta në VV kan...
Haxhiu ia tërheq vërejtjen Haradinajt: Kujdes me gjuhën, mos...
Haradinaj i ashpër në Kuvend: Në energji kryehajni është Kur...
Komandanti i FSK-së e pret në vizitë zyrtare Agjutantin e Pë...