Datorien Anderson's picture

Datorien Anderson

niltheory

·

https://occybyte.com

AI & ML interests

Deep Reinforcement Learning, Natural Language Processing Game Reasoning

Organizations

None yet

upvoted 2 papers over 1 year ago

HarmBench: A Standardized Evaluation Framework for Automated Red Teaming and Robust Refusal

Paper • 2402.04249 • Published Feb 6, 2024 • 7

Ferret: Faster and Effective Automated Red Teaming with Reward-Based Scoring Technique

Paper • 2408.10701 • Published Aug 20, 2024 • 12

upvoted 2 articles over 1 year ago

Article

Introducing the Red-Teaming Resistance Leaderboard

+2

steve-sli, richard2, leonardtang, clefourrier

•

Feb 23, 2024

• 13

Article

Red-Teaming Large Language Models

+1

nazneen, natolambert, lewtun

•

Feb 24, 2023

• 37

upvoted an article almost 2 years ago

Article

Llama 3.1 - 405B, 70B & 8B with multilinguality and long context

+6

philschmid, osanseviero, alvarobartt, lvwerra, dvilasuero, reach-vb, marcsun13, pcuenq

•

Jul 23, 2024

• 241

upvoted 3 papers over 2 years ago

Beyond Human Data: Scaling Self-Training for Problem-Solving with Language Models

Paper • 2312.06585 • Published Dec 11, 2023 • 29

LLM360: Towards Fully Transparent Open-Source LLMs

Paper • 2312.06550 • Published Dec 11, 2023 • 57

Controllable Human-Object Interaction Synthesis

Paper • 2312.03913 • Published Dec 6, 2023 • 23