Ai Safety

8 projects

Showing 8 of 8 projects

GarakPython

A command-line tool for red-teaming and vulnerability scanning of large language models (LLMs).

#ai#vulnerability-assessment#ai-safety

Stars8.6k

Forks1.1k

Last commit22 hours ago

Awesome Machine Learning Interpretability

A curated list of practical resources for responsible machine learning, covering interpretability, governance, safety, and ethics.

#ai-safety#xai#model-auditing

Stars4.0k

Forks629

Last commit1 month ago

ImitationPython

Clean PyTorch implementations of imitation and reward learning algorithms for reinforcement learning.

#behavioral-cloning#gymnasium#ai-safety

Stars1.8k

Forks303

Last commit1 year ago

prompt-injection-defenses

A centralized repository summarizing practical and proposed defenses against prompt injection attacks on large language models.

#ai#ai-safety#guardrails

Stars713

Forks57

Last commit1 year ago

Prompt Injection

A curated list of resources for understanding, detecting, and mitigating prompt injection attacks against machine learning models.

#ai-safety#red-teaming#awesome-list

Stars567

Forks105

Last commit1 month ago

Awesome Adversarial Deep Learning

A curated collection of resources on adversarial examples in deep learning, covering attacks, defenses, and applications.

#ai-safety#model-robustness#deep-learning

Stars266

Forks56

Last commit5 years ago

Safety in Embodied AI: Risks, Attacks, and DefensesPython

A comprehensive survey and unified safety framework for embodied AI, covering 400+ papers on risks, attacks, and defenses across perception, cognition, planning, interaction, and agentic systems.

#robotics#autonomous-driving#ai-safety

An open-source prompt guard model that detects prompt injection attacks while mitigating over-defense against benign inputs.

#adversarial-robustness#ai-safety#text-classification

Stars80

Forks9

Last commit7 months ago

Community-curated · Updated weekly · 100% open source

Found a gem we're missing?

Open-Awesome is built by the community, for the community. Submit a project, suggest an awesome list, or help improve the catalog on GitHub.

Submit a project Star on GitHub

Ai Safety

Related Tags

Found a gem we're missing?

Ai Safety

Related Tags

Found a gem we're missing?