nlp

38 stories

Artificial Intelligence #mental health#multilingual

Creating Multilingual Mental Health Datasets: Study Reveals Limits of Persona-Based Localization via Nationality and Language

A new arxiv paper investigates whether persona-based methods can generate multilingual mental health dialogue datasets by modifying nationality and language. The study found that just adding these parameters introduces clinical inconsistencies across languages, and LLM judge models exhibit inaccuracies in assessing depression severity in non-English texts, highlighting the need for culturally responsive data generation.

nlp

Creating Multilingual Mental Health Datasets: Study Reveals Limits of Persona-Based Localization via Nationality and Language

FineREX Boosts Knowledge Graph Quality by 31% in Human Smuggling Document Analysis

CREDENCE Framework Improves Automated Fact-Checking with Semantic Metrics and Convergence Analysis

Toten Framework Outperforms Statistical Tokenization for Physical Quantities in Brazilian Portuguese Technical Texts

DeFrame: New Technique Debiases LLMs Against Subtle Framing Effects

Prompt Injection Attacks on LLM-Based Grading Systems Pose Security Risks for Enterprise AI

Improving Code-Switching ASR with Code-Mixing Guided Synthetic Speech

Large Language Models Can Read Compressed Text That Humans Cannot, Researchers Find

G2Rec Framework Structures and Tokenizes User Interests for Generative Recommendation

New Method LUCID Detects Hallucinations in LLM-Based Knowledge Graph Reasoning

Before the Labels: How Dataset Construction Biases Suicidality Detection in Clinical Text

FAPO Framework Lets Claude Code Autonomously Optimize Multi-Step LLM Pipelines, Beats Baseline by 14.1 Points

Diffusion Language Models Show Promise but Demand Careful Inference Tuning, Study Finds

S-SPPO: Semantic Calibration Boosts LLM Preference Alignment Without Human Data

SAMark Watermarking Breaks Paraphrase Robustness Barrier for AI-Generated Text

New Hybrid Neuro-Symbolic Framework Achieves 78.1% Accuracy in Irony Detection Without Fine-Tuning

New Legal QA Benchmark Exposes Hallucination Risks in Statute-Centric AI Retrieval

Boosting Knowledge Graph Foundation Models via Enhanced Negative Sampling

New Framework TRACED Evaluates LLM Reasoning Using Geometric Stability and Progress

Fast-dLLM++ Boosts Diffusion LLM Inference Up to 37% With Fréchet Profile Decoding

SDS-LoRA: New Low-Rank Adaptation Method Fixes Gradient Distortion in Large Model Fine-Tuning

Self-Gated Clarification Method Boosts AI Accuracy in Complex Tariff Classification

G-Loss: New Graph-Guided Loss Function Boosts Language Model Fine-Tuning Accuracy

Self-Consistency Reranking Boosts Accuracy in Narrative Question Answering for Enterprise AI

ArtNet: JEPA-Like Articulatory Framework Achieves 20.56% Error Reduction in Zero-Shot Phoneme Recognition

P3B3 Benchmark Reveals Strong Brazilian Portuguese Bias in Large Language Models

New Research Reveals Truthfulness Preserved Across LLM Lineages, Enabling Better Hallucination Control

DeepRoot Multi-Agent System Enables Therapeutic Reasoning Over Historical Medical Texts with 47.6% Accuracy

LLM-Encoded Knowledge Guides Federated Graph Recommendation to Improve Accuracy

AdaMame: New Training Recipe Solves Language Collapse in Multilingual Reasoning Models

MMLongEmbed Benchmark Reveals Limitations in Long-Context Multimodal Embedding Models

New Self-Enhanced Fine-Tuning Method Boosts Text-to-SQL Reasoning and Generalization

New Method Resolves Drift Attribution Ambiguity in LLM Evaluation Pipelines

EHRNote-ChatQA: New Benchmark Tests LLMs on Multi-Turn Clinical Question Answering

Koshur Diacritizer: A Byte-Level Model Restores Diacritics for Kashmiri Language NLP

Researchers Tackle Annotator Disagreement to Improve Hate Speech Classification Accuracy

Data Augmentations Offer Path to Efficient Language Model Pretraining Under Data Constraints

Few-Shot Biomedical Relation Extraction with LLMs: A Viable Alternative to Supervised Learning?