Nicholas Stranges's picture

2 10

Nicholas Stranges

nstranges

·

strangeman99

AI & ML interests

Reinforcement learning, robotics, LLM agents.

Recent Activity

liked a dataset 12 days ago

open-r1/DAPO-Math-17k-Processed

updated a model 24 days ago

nstranges/smollm2-finetuned-chat-instruct-lora-adapters

published a model 25 days ago

nstranges/smollm2-finetuned-chat-instruct-lora-adapters

View all activity

Organizations

None yet

models 10

nstranges/smollm2-finetuned-chat-instruct-lora-adapters

Updated 24 days ago

nstranges/CSC2516-HW10-Original-Model

0.1B • Updated 25 days ago • 26

nstranges/Meta-Llama-3-8B-Instruct-OnlineDPO-Random-V2

8B • Updated Sep 21 • 7

nstranges/Meta-Llama-3-8B-Instruct-OnlineDPO-WIM-Zeta1.0-RefModel-V2

8B • Updated Sep 12 • 7

nstranges/Meta-Llama-3-8B-Instruct-OnlineDPO-WIM-Zeta1.0-RefModel

8B • Updated Aug 26 • 5

nstranges/Meta-Llama-3-8B-Instruct-OnlineDPO-WIM-Zeta1.0-V2

8B • Updated Aug 25 • 5

nstranges/Meta-Llama-3-8B-Instruct-OnlineDPO-WIM-Zeta0.0-V2

8B • Updated Aug 25 • 4

nstranges/Meta-Llama-3-8B-Instruct-OnlineDPO-Random

8B • Updated Aug 24 • 4

nstranges/Meta-Llama-3-8B-Instruct-OnlineDPO-WIM-Zeta0.0

8B • Updated Jun 27 • 10

nstranges/Meta-Llama-3-8B-Instruct-OnlineDPO-WIM-Zeta1.0

8B • Updated Jun 17 • 6

datasets 0

None public yet