ToolDeck

HTML to Markdown

HTML को Markdown फ़ॉर्मैट में बदलें

उदाहरण देखें

HTML इनपुट

Markdown आउटपुट

स्थानीय रूप से चलता है · सीक्रेट पेस्ट करना सुरक्षित है
Markdown आउटपुट यहाँ दिखाई देगा…

HTML से Markdown रूपांतरण क्या है?

HTML से Markdown रूपांतरण, HTML मार्कअप को Markdown में परिवर्तित करता है — Markdown एक हल्की सादे-पाठ स्वरूपण सिंटैक्स है जिसे John Gruber ने 2004 में बनाया था। Markdown को बिना रेंडरिंग के पठनीय होने के लिए डिज़ाइन किया गया था। जहाँ HTML को <strong> और <a href=""> जैसे खुलने और बंद होने वाले टैग की आवश्यकता होती है, वहीं Markdown संक्षिप्त वर्णों का उपयोग करता है: **बोल्ड**, [लिंक](url), और # हेडिंग। HTML को Markdown में बदलने से ऐसी फ़ाइलें प्राप्त होती हैं जो कच्चे HTML की तुलना में पढ़ने, संपादित करने और version control के लिए आसान होती हैं।

रूपांतरण प्रक्रिया HTML तत्वों को उनके Markdown समकक्षों से मैप करती है। <h2> ## बन जाता है, <ul><li> - आइटम बन जाता है, और <a> टैग [पाठ](url) बन जाता है। कुछ HTML तत्वों का कोई सीधा Markdown समकक्ष नहीं होता, जैसे <div>, <span>, या कस्टम डेटा विशेषताएँ। कनवर्टर सामान्यतः इन टैग को हटा देते हैं या कॉन्फ़िगरेशन के आधार पर उन्हें कच्चे HTML के रूप में पास करते हैं।

Markdown डेवलपर दस्तावेज़ीकरण (GitHub, GitLab, Bitbucket), static site generator (Hugo, Jekyll, Astro), नोट-लेखन एप्लिकेशन (Obsidian, Notion), और तकनीकी ब्लॉग के लिए मानक लेखन प्रारूप बन गया है। मौजूदा HTML सामग्री को Markdown में बदलना वेबसाइट स्थानांतरण, CMS सामग्री आयात, या वेब पृष्ठों को पोर्टेबल प्रारूप में संग्रहीत करने का एक सामान्य चरण है। HTML के विपरीत, Markdown फ़ाइलें version control में साफ diff देती हैं, जिससे documentation changes की code review आसान हो जाती है।

HTML से Markdown कनवर्टर का उपयोग क्यों करें?

HTML को मैन्युअल रूप से Markdown के रूप में फिर से लिखना धीमा और त्रुटि-प्रवण है, विशेष रूप से नेस्टेड सूचियों, तालिकाओं, या दर्जनों लिंक वाले पृष्ठों के लिए। एक स्वचालित कनवर्टर संरचनात्मक मैपिंग को तुरंत और सुसंगत रूप से संभालता है।

ब्राउज़र में तत्काल कनवर्ट करें
HTML चिपकाएँ और मिलीसेकंड में Markdown आउटपुट प्राप्त करें। कोई सर्वर राउंड-ट्रिप नहीं, कोई processing queue नहीं। रूपांतरण पूरी तरह से JavaScript का उपयोग करके आपके ब्राउज़र में चलता है।
🔒
अपना डेटा निजी रखें
आपका HTML कभी भी आपकी मशीन नहीं छोड़ता। सारा processing client-side होता है — कोई upload नहीं, कोई logging नहीं, और आपकी content तक कोई third-party access नहीं।
📝
दस्तावेज़ संरचना सुरक्षित रखें
हेडिंग, सूचियाँ, लिंक, चित्र, कोड ब्लॉक और तालिकाएँ उनके सही Markdown समकक्षों से मैप की जाती हैं। Nested structures और inline formatting को recursively handle किया जाता है।
🔀
कोई अकाउंट या इंस्टॉलेशन आवश्यक नहीं
टूल खोलें और कनवर्ट करना शुरू करें। इंस्टॉल करने के लिए कुछ नहीं, कोई API कुंजी कॉन्फ़िगर करने की आवश्यकता नहीं, और कोई साइन-अप फ़ॉर्म नहीं। आधुनिक ब्राउज़र वाले किसी भी उपकरण पर काम करता है।

HTML से Markdown के उपयोग के मामले

फ्रंटएंड डेवलपर: CMS स्थानांतरण
WordPress, Drupal, या हेडलेस CMS से ब्लॉग पोस्ट या पृष्ठ HTML के रूप में निर्यात करें, फिर उन्हें Next.js, Astro, या Hugo जैसे static site generator के साथ उपयोग के लिए Markdown में बदलें।
बैकएंड इंजीनियर: API दस्तावेज़ीकरण
स्वचालित रूप से उत्पन्न HTML API दस्तावेज़ को Markdown फ़ाइलों में बदलें जो आपके स्रोत कोड के साथ रहती हैं। Markdown दस्तावेज़ GitHub रेंडरिंग के साथ एकीकृत होते हैं और उस कोड के साथ संस्करणबद्ध किए जा सकते हैं जिसका वे वर्णन करते हैं।
DevOps: रनबुक रूपांतरण
HTML के रूप में निर्यात किए गए आंतरिक विकी पृष्ठों (Confluence, SharePoint) को Markdown runbooks में बदलें जो उनसे जुड़े infrastructure code के साथ आपकी Git repository में रहें।
QA इंजीनियर: परीक्षण मामला दस्तावेज़ीकरण
वेब-आधारित टूल से HTML परीक्षण रिपोर्ट या मैन्युअल परीक्षण योजनाओं को Markdown फ़ाइलों में बदलें जिन्हें उन कोड परिवर्तनों के साथ पुल अनुरोधों में समीक्षा की जा सके जिन्हें वे सत्यापित करती हैं।
डेटा इंजीनियर: वेब स्क्रेपिंग सफाई
स्क्रैप किए गए वेब पृष्ठों से HTML बॉयलरप्लेट हटाएँ और स्वच्छ Markdown पाठ उत्पन्न करें। यह लेख की सामग्री और संरचना को सुरक्षित रखते हुए नेविगेशन, विज्ञापनों और लेआउट मार्कअप को हटाता है।
छात्र: शोध नोट्स
वेब संसाधनों से सामग्री कॉपी करें और Obsidian, Notion, या किसी Markdown-आधारित नोट-लेखन प्रणाली में आयात के लिए HTML को Markdown में बदलें। हेडिंग, लिंक और स्वरूपण सुरक्षित रहते हैं।

HTML से Markdown तत्व संदर्भ

नीचे दी गई तालिका दिखाती है कि सामान्य HTML तत्व उनके Markdown समकक्षों से कैसे मैप होते हैं। यह मैपिंग GitHub-Flavored Markdown (GFM) परंपराओं का अनुसरण करती है, जो तालिकाओं, स्ट्राइकथ्रू और टास्क सूचियों के साथ CommonMark विनिर्देश का विस्तार करती है। यहाँ सूचीबद्ध नहीं किए गए तत्व (जैसे <div>, <form>, या कस्टम वेब घटक) का कोई Markdown समकक्ष नहीं है और उन्हें या तो हटाया जाता है या कच्चे HTML के रूप में पास किया जाता है।

HTML तत्वMarkdown सिंटैक्सटिप्पणियाँ
<h1>...<h6># ... ######ATX headings, level matches tag number
<p>Blank line separationDouble newline between paragraphs
<strong>, <b>**text**Bold / strong emphasis
<em>, <i>*text*Italic / emphasis
<a href="url">[text](url)Inline link with optional title
<img src="url">![alt](url)Image with alt text
<ul><li>- itemUnordered list with dash or asterisk
<ol><li>1. itemOrdered list, numbers restart per block
<blockquote>> textBlock quote, nestable with >>
<code>`code`Inline code span
<pre><code>```lang\ncode\n```Fenced code block with optional language
<hr>---Horizontal rule (three dashes)
<table>| col | col |GFM table syntax with alignment
<del>, <s>~~text~~Strikethrough (GFM extension)

Markdown के प्रकार: GFM बनाम CommonMark बनाम मूल

सभी Markdown एक समान नहीं होते। आउटपुट प्रारूप महत्वपूर्ण है क्योंकि विभिन्न प्लेटफ़ॉर्म Markdown को अलग-अलग तरीके से पार्स करते हैं। तीन सबसे सामान्य प्रकार हैं GitHub-Flavored Markdown (GFM), CommonMark, और Gruber का मूल Markdown।

GitHub-Flavored Markdown (GFM)
सबसे व्यापक रूप से उपयोग किया जाने वाला प्रकार। तालिकाएँ (पाइप सिंटैक्स), स्ट्राइकथ्रू (~~पाठ~~), टास्क सूचियाँ (- [x]), और स्वचालित लिंक किए गए URL जोड़ता है। GitHub, GitLab, और अधिकांश डेवलपर टूल द्वारा उपयोग किया जाता है। यह कनवर्टर डिफ़ॉल्ट रूप से GFM-संगत Markdown आउटपुट करता है।
CommonMark
एक कठोर विनिर्देश जो मूल Markdown सिंटैक्स में अस्पष्टताओं को हल करता है। सूची निरंतरता, जोर पार्सिंग, और ब्लॉक-स्तर नेस्टिंग के लिए सटीक नियम परिभाषित करता है। GFM और कई static site generator के लिए आधार के रूप में उपयोग किया जाता है।
मूल Markdown
John Gruber का 2004 विनिर्देश। तालिकाओं, फ़ेंस्ड कोड ब्लॉक, या स्ट्राइकथ्रू का समर्थन नहीं करता। अधिकांश आधुनिक टूल इसे CommonMark के उपसमुच्चय के रूप में मानते हैं। आज लक्ष्य प्रारूप के रूप में शायद ही कभी उपयोग किया जाता है।

कोड उदाहरण

JavaScript (Turndown), Python (markdownify और html2text), Go, और कमांड लाइन पर Pandoc में कार्यशील उदाहरण।

JavaScript (Turndown)
import TurndownService from 'turndown'

const turndown = new TurndownService({ headingStyle: 'atx' })
const html = '<h1>Title</h1><p>A <strong>bold</strong> paragraph.</p>'
const md = turndown.turndown(html)
console.log(md)
// → "# Title\n\nA **bold** paragraph."
Python (markdownify)
from markdownify import markdownify

html = '<h2>Section</h2><ul><li>First</li><li>Second</li></ul>'
md = markdownify(html, heading_style='ATX')
print(md)
# → "## Section\n\n- First\n- Second"
Python (html2text)
import html2text

converter = html2text.HTML2Text()
converter.body_width = 0  # disable line wrapping

html = '<p>Visit <a href="https://example.com">Example</a> for details.</p>'
md = converter.handle(html)
print(md)
# → "Visit [Example](https://example.com) for details."
Go (html-to-markdown)
package main

import (
	"fmt"
	md "github.com/JohannesKaufmann/html-to-markdown"
)

func main() {
	converter := md.NewConverter("", true, nil)
	html := `<h3>Go Example</h3><p>Code: <code>fmt.Println()</code></p>`
	markdown, _ := converter.ConvertString(html)
	fmt.Println(markdown)
	// → "### Go Example\n\nCode: `fmt.Println()`"
}
CLI (Pandoc)
# Convert an HTML file to Markdown
pandoc input.html -f html -t markdown -o output.md

# Pipe HTML from stdin
echo '<p>Hello <em>world</em></p>' | pandoc -f html -t markdown
# → Hello *world*

# Use GitHub-Flavored Markdown output
pandoc input.html -f html -t gfm -o output.md

अक्सर पूछे जाने वाले प्रश्न

कौन से HTML तत्वों को Markdown में नहीं बदला जा सकता?
Markdown में <div>, <span>, <form>, <input>, <iframe>, या कस्टम CSS क्लास और स्टाइल वाले किसी भी तत्व का कोई समकक्ष नहीं है। अधिकांश कनवर्टर इन टैग को हटा देते हैं और केवल आंतरिक पाठ रखते हैं। कुछ कनवर्टर असमर्थित HTML को अपरिवर्तित रूप से पास कर सकते हैं, जो वैध है क्योंकि Markdown विनिर्देश स्पष्ट रूप से इनलाइन HTML की अनुमति देता है। यदि आपको उन तत्वों को सुरक्षित रखना है, तो अपने कनवर्टर को हटाने के बजाय कच्चे HTML को रखने के लिए कॉन्फ़िगर करें।
HTML तालिकाओं को Markdown में कैसे बदला जाता है?
HTML तालिकाएँ GFM पाइप-तालिका सिंटैक्स से मैप होती हैं: | हेडर | हेडर | एक विभाजक पंक्ति | --- | --- | के साथ। GFM तालिकाएँ colspan, rowspan, या सेल-स्तर स्टाइलिंग का समर्थन नहीं करतीं। मर्ज किए गए सेल वाली जटिल तालिकाएँ समतल हो जाती हैं, जिससे संरचनात्मक जानकारी नष्ट हो सकती है। साधारण डेटा तालिकाओं के लिए, रूपांतरण बिना किसी हानि के होता है।
क्या HTML से Markdown में रूपांतरण बिना हानि के होता है?
नहीं। Markdown, HTML का उपसमुच्चय है, इसलिए रूपांतरण के दौरान कुछ जानकारी हमेशा नष्ट होती है। CSS क्लास, इनलाइन स्टाइल, डेटा विशेषताएँ, फ़ॉर्म तत्व, और <article> या <section> जैसे अर्थपूर्ण टैग का Markdown में कोई समकक्ष नहीं है। पाठ सामग्री और बुनियादी संरचना (हेडिंग, सूचियाँ, लिंक, जोर) सटीक रूप से सुरक्षित रहती है। अधिकांश दस्तावेज़ीकरण और सामग्री स्थानांतरण कार्यप्रवाह के लिए, सुरक्षित तत्व वही होते हैं जो महत्वपूर्ण होते हैं।
HTML से Markdown और HTML से सादे पाठ में क्या अंतर है?
HTML से सादे पाठ में सभी स्वरूपण हटा दिया जाता है और बिना किसी संरचना के कच्चा पाठ उत्पन्न होता है। HTML से Markdown दस्तावेज़ संरचना को सुरक्षित रखता है: हेडिंग हेडिंग रहती हैं, लिंक अपने URL के साथ बने रहते हैं, सूचियाँ सूचियों के रूप में रहती हैं, और जोर बना रहता है। Markdown आउटपुट को समान तार्किक संरचना के साथ HTML में वापस रेंडर किया जा सकता है।
क्या मैं Markdown को वापस HTML में बदल सकता हूँ?
हाँ। हर Markdown प्रोसेसर (marked, markdown-it, Python-Markdown, goldmark) Markdown को HTML में बदलता है। यह राउंड-ट्रिप एक कारण है जिससे Markdown लोकप्रिय है: आप पठनीय प्रारूप में लिखते हैं और वेब के लिए HTML में रेंडर करते हैं। राउंड-ट्रिप पूरी तरह से सममितीय नहीं है क्योंकि HTML से Markdown रूपांतरण असमर्थित तत्वों को हटा देता है।
कनवर्टर इनलाइन CSS या JavaScript वाले HTML को कैसे संभालता है?
इनलाइन CSS (स्टाइल विशेषताएँ) और <style> ब्लॉक रूपांतरण के दौरान हटा दिए जाते हैं क्योंकि Markdown में कोई स्टाइलिंग सिंटैक्स नहीं है। JavaScript (<script> टैग और onclick जैसे इवेंट हैंडलर) भी हटा दिए जाते हैं। कनवर्टर केवल दस्तावेज़ सामग्री और संरचना निकालता है। यह आपके दस्तावेज़ीकरण में अविश्वसनीय HTML सामग्री आयात करते समय HTML से Markdown रूपांतरण को एक उपयोगी स्वच्छता चरण बनाता है।
मेरे प्रोजेक्ट के लिए कौन सा Markdown प्रकार उपयोग करना चाहिए?
GitHub-Flavored Markdown (GFM) का उपयोग करें यदि आपकी सामग्री GitHub, GitLab, या अधिकांश दस्तावेज़ीकरण प्लेटफ़ॉर्म पर देखी जाएगी। CommonMark का उपयोग करें यदि आपको कठोर विनिर्देश अनुपालन और विभिन्न रेंडरर के बीच पूर्वानुमानित पार्सिंग की आवश्यकता है। मूल Markdown केवल पुराने प्रणालियों के लिए प्रासंगिक है। GFM अधिकांश प्रोजेक्ट के लिए सबसे सुरक्षित डिफ़ॉल्ट है।