ToolDeck

فرار و بازگردانی HTML

موجودیت‌های HTML را فرار و بازگردانی کنید (& < > " و غیره)

یک مثال امتحان کنید

ورودی

خروجی

به‌صورت محلی اجرا می‌شود · جای‌گذاری اسرار امن است
نتیجه اینجا نمایش داده می‌شود…

فرار HTML چیست؟

فرار HTML فرایندی است که در آن کاراکترهایی که در HTML معنای خاص دارند با مراجع موجودیت متناظرشان جایگزین می‌شوند. پنج کاراکتری که باید فرار داده شوند عبارتند از: علامت و (&)، کمتر از (<)، بیشتر از (>)، نقل‌قول دوگانه (") و نقل‌قول تکی ('). بدون فرار، مرورگر این کاراکترها را به‌جای متن قابل نمایش، به‌عنوان دستورالعمل نشانه‌گذاری تفسیر می‌کند که هم رندر صفحه را خراب می‌کند و هم در برابر حملات تزریق آسیب‌پذیری ایجاد می‌کند.

مشخصات HTML (که توسط WHATWG نگهداری می‌شود) دو شکل از مراجع کاراکتر تعریف می‌کند: موجودیت‌های نامی مانند &amp; و موجودیت‌های عددی مانند &#38; یا &#x26;. موجودیت‌های نامی در کد منبع راحت‌تر خوانده می‌شوند. موجودیت‌های عددی (اعشاری یا هگزادسیمال) می‌توانند هر نقطه کد Unicode را نمایش دهند و برای کاراکترهایی که نام مستعار ندارند مفید هستند. هر دو شکل در مرورگر خروجی یکسانی تولید می‌کنند.

بازگردانی (که به آن رمزگشایی نیز گفته می‌شود) عملیات معکوس است: تبدیل مراجع موجودیت به کاراکترهای واقعی. این عملیات هنگام استخراج متن از کد منبع HTML، مهاجرت محتوا بین سیستم‌ها، یا اشکال‌زدایی قالب‌هایی که موجودیت‌ها را دوبار رمزگذاری می‌کنند رایج است. این ابزار هر دو جهت را در مرورگر پردازش می‌کند، بنابراین می‌توانید منطق فرار خود را در چند ثانیه تأیید کنید یا متن ساده را از یک منبع HTML پر بازیابی کنید.

چرا از ابزار فرار HTML استفاده کنیم؟

جایگزینی دستی کروشه‌های زاویه‌ای و علامت‌های و در متون حجیم خسته‌کننده و مستعد خطاست. یک ابزار اختصاصی ورودی شما را در یک مرحله تبدیل می‌کند، بدون نیاز به نصب.

تبدیل فوری
متن یا HTML را پیست کنید و فوراً خروجی اسکیپ‌شده یا آن‌اسکیپ‌شده دریافت کنید. انتظار برای رفت‌وبرگشت سرور لازم نیست چون تمام پردازش به‌صورت محلی در JavaScript انجام می‌شود.
🔒
پردازش با اولویت حریم خصوصی
ورودی شما هرگز مرورگر را ترک نمی‌کند. هیچ چیزی به سرور ارسال یا در هیچ جایی ذخیره نمی‌شود، بنابراین می‌توانید با خیال راحت نشانه‌گذاری حاوی اعتبارنامه‌ها، کلیدهای API یا کد داخلی را فرار دهید.
📋
بدون حساب کاربری یا راه‌اندازی
صفحه را باز کنید و شروع کنید به پیست کردن. دیوار ورود، تأیید ایمیل و نرم‌افزاری برای نصب وجود ندارد. روی هر دستگاهی با یک مرورگر مدرن کار می‌کند.
🌐
پوشش کامل موجودیت‌ها
پنج کاراکتر خاص HTML اجباری به‌علاوه موجودیت‌های عددی (اعشاری و هگزادسیمال) را پردازش می‌کند. از تبدیل رفت‌وبرگشت پشتیبانی می‌کند: فرار و سپس بازگردانی رشته اصلی را برمی‌گرداند.

موارد استفاده از فرار HTML

توسعه‌دهنده فرانت‌اند: نمایش ورودی کاربر
هنگام رندر متن ارسال‌شده توسط کاربر در صفحه، ابتدا آن را فرار دهید تا مرورگر آن را به‌عنوان تگ‌های HTML تفسیر نکند. این دفاع اصلی در برابر XSS ذخیره‌شده در هر قالبی است که رشته‌های خام را خروجی می‌دهد.
مهندس بک‌اند: تولید پاسخ‌های HTML
کد سمت سرور که رشته‌ها را به HTML الحاق می‌کند باید مقادیر پویا را قبل از درج فرار دهد. از این ابزار استفاده کنید تا تأیید کنید که تابع فرار شما برای موارد لبه‌ای مانند نقل‌قول‌های تودرتو خروجی صحیح تولید می‌کند.
DevOps: جاسازی پیکربندی در HTML
JSON درون‌خطی یا دستورات shell داخل یک صفحه HTML (برای مثال در یک تگ script یا یک ویژگی data) نیاز به فرار دارند. تأیید کنید که کروشه‌های زاویه‌ای و علامت‌های و در قطعات پیکربندی شما به درستی رمزگذاری شده‌اند.
مهندس QA: آزمایش بردارهای XSS
بارهای معمول XSS را در ابزار پیست کنید تا تأیید کنید که خروجی برنامه با نسخه فرارشده صحیح مطابقت دارد. خروجی فرارشده را کاراکتر به کاراکتر با آنچه برنامه شما تولید می‌کند مقایسه کنید.
نویسنده فنی: نمونه‌های کد در مستندات
انتشار قطعات کد در مستندات مبتنی بر HTML (Jekyll، Hugo، CMSهای سفارشی) مستلزم فرار کروشه‌های زاویه‌ای برای نحو نوع جنریک و مکان‌نگهدارهای قالب است. نمونه کد خود را پیست کنید و هر کاراکتر خاص فوراً رمزگذاری می‌شود.
دانشجو: یادگیری موجودیت‌های HTML
هر کاراکتری را تایپ یا الصاق کنید و شکل‌های موجودیت نامی و عددی آن را ببینید. با موارد لبه‌ای مانند فاصله‌های بدون شکست، خط تیره‌های em و نمادهای Unicode آزمایش کنید تا نحوه عملکرد رمزگذاری کاراکتر HTML را درک کنید.

جدول مرجع موجودیت‌های HTML

جدول زیر موجودیت‌های HTML پرکاربرد را فهرست می‌کند. پنج کاراکتر خاص (& < > " ') باید همیشه در محتوای HTML و مقادیر ویژگی فرار داده شوند. سایر موجودیت‌ها اختیاری هستند اما برای کاراکترهایی که تایپشان دشوار است یا در کد منبع ابهام دارند مفیدند.

کاراکترتوضیحموجودیت نامیموجودیت عددی
&Ampersand&amp;&#38;
<Less-than sign&lt;&#60;
>Greater-than sign&gt;&#62;
"Double quote&quot;&#34;
'Single quote / apostrophe&apos;&#39;
 Non-breaking space&nbsp;&#160;
©Copyright sign&copy;&#169;
®Registered sign&reg;&#174;
Em dash&mdash;&#8212;
Right single quote&rsquo;&#8217;
Euro sign&euro;&#8364;

فرار در مقابل بازگردانی: چه زمانی از کدام استفاده کنیم

این دو عملیات معکوس یکدیگرند. انتخاب جهت اشتباه منجر به خروجی دوبار رمزگذاری‌شده یا ناامن می‌شود.

فرار (رمزگذاری)
هنگام درج متن نامعتبر یا پویا در HTML استفاده کنید. < واقعی را به &lt; تبدیل می‌کند تا مرورگر کاراکتر را نمایش دهد به‌جای اینکه یک تگ شروع کند. قبل از رندر ورودی کاربر، ورودی‌های گزارش، یا هر رشته‌ای که ممکن است حاوی نشانه‌گذاری باشد اعمال کنید.
بازگردانی (رمزگشایی)
هنگام استخراج متن ساده از منبع HTML استفاده کنید. &lt; را به < برمی‌گرداند. هنگام مهاجرت محتوا از یک CMS، تجزیه HTML خزیده‌شده، یا رفع رشته‌های دوبار رمزگذاری‌شده مانند &amp;amp; که نام موجودیت‌ها را به‌جای کاراکترها نمایش می‌دهند اعمال کنید.

نمونه‌های کد

در زیر نمونه‌های کاری از فرار و بازگردانی HTML در چهار زبان برنامه‌نویسی آمده است. هر قطعه هر دو جهت را پوشش می‌دهد و موارد لبه‌ای مانند نقل‌قول‌های تودرتو و موجودیت‌های عددی را مدیریت می‌کند.

JavaScript (browser / Node.js)
// Escape HTML entities manually
function escapeHtml(str) {
  return str
    .replace(/&/g, '&amp;')
    .replace(/</g, '&lt;')
    .replace(/>/g, '&gt;')
    .replace(/"/g, '&quot;')
    .replace(/'/g, '&#39;')
}

escapeHtml('<img src="x" onerror="alert(1)">')
// → "&lt;img src=&quot;x&quot; onerror=&quot;alert(1)&quot;&gt;"

// Unescape using DOMParser (browser only)
function unescapeHtml(str) {
  const doc = new DOMParser().parseFromString(str, 'text/html')
  return doc.documentElement.textContent
}

unescapeHtml('&lt;div&gt;Hello&lt;/div&gt;')
// → "<div>Hello</div>"
Python
import html

# Escape special characters
html.escape('<script>alert("XSS")</script>')
# → '&lt;script&gt;alert(&quot;XSS&quot;)&lt;/script&gt;'

# Escape including single quotes (quote=True is default in Python 3.8+)
html.escape("It's <b>bold</b>", quote=True)
# → 'It&#x27;s &lt;b&gt;bold&lt;/b&gt;'

# Unescape entities back to characters
html.unescape('&lt;p&gt;Price: &euro;10&lt;/p&gt;')
# → '<p>Price: €10</p>'

# Unescape numeric entities
html.unescape('&#60;div&#62;&#38;amp;&#60;/div&#62;')
# → '<div>&amp;</div>'
Go
package main

import (
    "fmt"
    "html"
)

func main() {
    // Escape HTML special characters
    escaped := html.EscapeString(`<a href="page?id=1&sort=name">Link</a>`)
    fmt.Println(escaped)
    // → &lt;a href=&quot;page?id=1&amp;sort=name&quot;&gt;Link&lt;/a&gt;

    // Unescape back to original
    original := html.UnescapeString("&lt;b&gt;Go &amp; HTML&lt;/b&gt;")
    fmt.Println(original)
    // → <b>Go & HTML</b>
}
PHP
<?php
// Escape HTML entities (ENT_QUOTES escapes both " and ')
echo htmlspecialchars('<p class="info">Tom & Jerry's</p>', ENT_QUOTES, 'UTF-8');
// → &lt;p class=&quot;info&quot;&gt;Tom &amp; Jerry&#039;s&lt;/p&gt;

// Convert all applicable characters to HTML entities
echo htmlentities('Price: 10€ — 50% off', ENT_QUOTES, 'UTF-8');
// → Price: 10&euro; &mdash; 50% off

// Decode entities back
echo html_entity_decode('&lt;div&gt;&amp;copy; 2026&lt;/div&gt;');
// → <div>&copy; 2026</div>

سوالات متداول

تفاوت بین فرار HTML و رمزگذاری URL چیست؟
فرار HTML کاراکترهایی که در HTML خاص هستند (< > & " ') را با مراجع موجودیت مانند &lt; جایگزین می‌کند تا به‌صورت متن نمایش داده شوند. رمزگذاری URL (percent-encoding) کاراکترهایی که در URL ناامن هستند را با دنباله‌های هگزادسیمال %XX جایگزین می‌کند. آن‌ها زمینه‌های مختلفی را محافظت می‌کنند: فرار HTML از تزریق نشانه‌گذاری جلوگیری می‌کند، در حالی که رمزگذاری URL رشته‌های جستجو و بخش‌های مسیر معتبر را تضمین می‌کند.
کدام کاراکترها باید در HTML فرار داده شوند؟
پنج کاراکتری که همیشه باید فرار داده شوند عبارتند از: & (علامت و)، < (کمتر از)، > (بیشتر از)، " (نقل‌قول دوگانه در داخل ویژگی‌ها) و ' (نقل‌قول تکی در داخل ویژگی‌ها). عدم فرار هر یک از این‌ها می‌تواند رندر را خراب کند یا آسیب‌پذیری cross-site scripting ایجاد کند.
آیا &apos; در HTML5 معتبر است؟
بله. موجودیت نامی &apos; در مشخصات HTML5 تعریف شده و توسط تمام مرورگرهای مدرن پشتیبانی می‌شود. این موجودیت بخشی از HTML 4 نبود که فقط &amp;، &lt;، &gt; و &quot; را می‌شناخت. اگر نیاز به پشتیبانی از تجزیه‌کننده‌های قدیمی HTML 4 دارید، از شکل عددی &#39; استفاده کنید.
چگونه موجودیت‌های HTML دوبار رمزگذاری‌شده مانند &amp;amp; را رفع کنم؟
رمزگذاری مضاعف زمانی رخ می‌دهد که یک رشته از قبل فرارشده برای بار دوم از تابع فرار عبور کند. راه‌حل این است که تا زمانی که خروجی پایدار شود بازگردانی کنید. رشته دوبار رمزگذاری‌شده را در حالت آن‌اسکیپ در این ابزار پیست کنید، سپس اگر مراجع &amp; باقی ماندند دوباره اجرا کنید. برای جلوگیری از رمزگذاری مضاعف، قبل از اعمال تابع فرار بررسی کنید که ورودی از قبل فرار شده است یا نه.
آیا می‌توانم از موجودیت‌های HTML در رشته‌های JavaScript استفاده کنم؟
موجودیت‌های HTML توسط تجزیه‌کننده HTML تفسیر می‌شوند، نه موتور JavaScript. داخل یک بلوک script، کد بعد از پردازش صفحه توسط تجزیه‌کننده HTML اجرا می‌شود، بنابراین &lt; در یک بلوک script قبل از اینکه JavaScript آن را ببیند به < تبدیل می‌شود. برای کنترل‌کننده‌های رویداد درون‌خطی (onclick و غیره)، مقدار ویژگی ابتدا از HTML رمزگشایی می‌شود، سپس به‌عنوان JavaScript اجرا می‌شود. در فایل‌های خارجی .js، موجودیت‌ها معنای خاصی ندارند و به‌عنوان متن واقعی تلقی می‌شوند.
تفاوت بین htmlspecialchars و htmlentities در PHP چیست؟
htmlspecialchars() فقط پنج کاراکتر خاص (& < > " ') که بر ساختار HTML تأثیر می‌گذارند را فرار می‌دهد. htmlentities() آن پنج کاراکتر به‌علاوه هر کاراکتری که موجودیت HTML نامی دارد مانند نماد کپی‌رایت و حروف لهجه‌دار را فرار می‌دهد. برای اهداف امنیتی، htmlspecialchars() با ENT_QUOTES کافی است. htmlentities() زمانی مفید است که به خروجی امن ASCII برای سیستم‌هایی که نمی‌توانند UTF-8 را مدیریت کنند نیاز دارید.
آیا فرار HTML برای جلوگیری از XSS کافی است؟
فرار HTML در رایج‌ترین حالت از XSS جلوگیری می‌کند: درج متن نامعتبر در محتوای عناصر HTML یا مقادیر ویژگی. از دیگر زمینه‌های تزریق محافظت نمی‌کند. درج داده کاربر در یک بلوک script نیاز به فرار رشته JavaScript دارد. درج در یک ویژگی style نیاز به فرار CSS دارد. درج در یک ویژگی URL (href، src) نیاز به اعتبارسنجی URL به‌علاوه رمزگذاری دارد. یک دفاع کامل در برابر XSS در هر نقطه درج، فرار خاص زمینه را اعمال می‌کند.