HTML till Markdown-konvertering omvandlar HTML-uppmärkning till Markdown, ett lättviktigt syntaxformat för vanlig text som skapades av John Gruber år 2004. Markdown designades för att vara läsbart utan rendering. Där HTML kräver öppnings- och stängningstaggar som <strong> och <a href="">, använder Markdown kortkommandon: **fetstil**, [länkar](url) och # rubriker. Att konvertera HTML till Markdown producerar filer som är enklare att läsa, redigera och versionshantera än rå HTML.
Konverteringsprocessen mappar HTML-element till deras Markdown-motsvarigheter. Ett <h2> blir ##, ett <ul><li> blir - post, och ett <a>-tagg blir [text](url). Vissa HTML-element saknar direkt Markdown-motsvarighet, till exempel <div>, <span> eller anpassade dataattribut. Konverterare tar vanligtvis bort dessa taggar eller skickar dem vidare som rå HTML, beroende på konfiguration.
Markdown har blivit standardformatet för utvecklardokumentation (GitHub, GitLab, Bitbucket), statiska webbplatsgeneratorer (Hugo, Jekyll, Astro), anteckningsappar (Obsidian, Notion) och tekniska bloggar. Att konvertera befintligt HTML-innehåll till Markdown är ett vanligt steg vid migrering av webbplatser, import av CMS-innehåll eller arkivering av webbsidor i ett portabelt format. Till skillnad från HTML producerar Markdown-filer rena diff:ar i versionshantering, vilket gör kodgranskning av dokumentationsändringar praktiskt.
Varför använda en HTML till Markdown-konverterare?
Att manuellt skriva om HTML som Markdown är långsamt och felbenäget, särskilt för sidor med nästlade listor, tabeller eller dussintals länkar. En automatiserad konverterare hanterar strukturmappningen direkt och konsekvent.
⚡
Konvertera direkt i webbläsaren
Klistra in HTML och få Markdown-utdata på millisekunder. Ingen serveromgång, inget väntan på bearbetningsköer. Konverteringen körs helt i din webbläsare med JavaScript.
🔒
Håll dina data privata
Din HTML lämnar aldrig din dator. All bearbetning sker på klientsidan, så det finns ingen uppladdning, ingen loggning och ingen tredjepartsåtkomst till ditt innehåll.
📝
Bevara dokumentstrukturen
Rubriker, listor, länkar, bilder, kodblock och tabeller mappas till sina korrekta Markdown-motsvarigheter. Nästlade strukturer och inline-formatering hanteras rekursivt.
🔀
Inget konto eller installation krävs
Öppna verktyget och börja konvertera. Det finns inget att installera, ingen API-nyckel att konfigurera och inget registreringsformulär. Fungerar på alla enheter med en modern webbläsare.
Användningsfall för HTML till Markdown
Frontendutvecklare: CMS-migrering
Exportera blogginlägg eller sidor från WordPress, Drupal eller ett headless CMS som HTML och konvertera dem sedan till Markdown för användning med statiska webbplatsgeneratorer som Next.js, Astro eller Hugo.
Backendutvecklare: API-dokumentation
Konvertera autogenererade HTML API-dokument till Markdown-filer som lagras bredvid din källkod. Markdown-dokument integreras med GitHub-rendering och kan versionshanteras tillsammans med koden de beskriver.
DevOps: Konvertering av drifthandböcker
Omvandla interna wiki-sidor (Confluence, SharePoint) som exporterats som HTML till Markdown-drifthandböcker lagrade i ditt Git-förråd bredvid den infrastrukturkod de beskriver.
QA-ingenjör: Dokumentation av testfall
Konvertera HTML-testrapporter eller manuella testplaner från webbaserade verktyg till Markdown-filer som kan granskas i pull requests bredvid de kodändringar de verifierar.
Dataingenjör: Städning av webbskrapning
Ta bort HTML-standardkod från skrapade webbsidor och producera ren Markdown-text. Det tar bort navigering, annonser och layout-uppmärkning och bevarar artikelns innehåll och struktur.
Student: Forskningsanteckningar
Kopiera innehåll från webbresurser och konvertera HTML till Markdown för import till Obsidian, Notion eller något annat Markdown-baserat anteckningssystem. Bevarar rubriker, länkar och formatering.
HTML till Markdown-elementreferens
Tabellen nedan visar hur vanliga HTML-element mappas till sina Markdown-motsvarigheter. Mappningen följer GitHub-Flavored Markdown (GFM)-konventioner, som utökar CommonMark-specifikationen med tabeller, genomstrykning och uppgiftslistor. Element som inte listas här (till exempel <div>, <form> eller anpassade webbkomponenter) saknar Markdown-motsvarighet och tas antingen bort eller skickas vidare som rå HTML.
HTML-element
Markdown-syntax
Anteckningar
<h1>...<h6>
# ... ######
ATX headings, level matches tag number
<p>
Blank line separation
Double newline between paragraphs
<strong>, <b>
**text**
Bold / strong emphasis
<em>, <i>
*text*
Italic / emphasis
<a href="url">
[text](url)
Inline link with optional title
<img src="url">

Image with alt text
<ul><li>
- item
Unordered list with dash or asterisk
<ol><li>
1. item
Ordered list, numbers restart per block
<blockquote>
> text
Block quote, nestable with >>
<code>
`code`
Inline code span
<pre><code>
```lang\ncode\n```
Fenced code block with optional language
<hr>
---
Horizontal rule (three dashes)
<table>
| col | col |
GFM table syntax with alignment
<del>, <s>
~~text~~
Strikethrough (GFM extension)
Markdown-varianter: GFM vs CommonMark vs original
Inte all Markdown är densamma. Utdataformatet spelar roll eftersom olika plattformar tolkar Markdown på olika sätt. De tre vanligaste varianterna är GitHub-Flavored Markdown (GFM), CommonMark och Grubers ursprungliga Markdown.
GitHub-Flavored Markdown (GFM)
Den mest använda varianten. Lägger till tabeller (pipe-syntax), genomstrykning (~~text~~), uppgiftslistor (- [x]) och automatiskt länkade URL:er. Används av GitHub, GitLab och de flesta utvecklarverktyg. Den här konverteraren producerar GFM-kompatibel Markdown som standard.
CommonMark
En strikt specifikation som löser tvetydigheter i den ursprungliga Markdown-syntaxen. Definierar exakta regler för listfortsättning, teckenparsning och nästling på blocknivå. Används som bas för GFM och många statiska webbplatsgeneratorer.
Ursprunglig Markdown
John Grubers specifikation från 2004. Stöder inte tabeller, avgränsade kodblock eller genomstrykning. De flesta moderna verktyg behandlar den som en delmängd av CommonMark. Används sällan som målformat idag.
Kodexempel
Praktiska exempel i JavaScript (Turndown), Python (markdownify och html2text), Go och Pandoc på kommandoraden.
JavaScript (Turndown)
import TurndownService from 'turndown'
const turndown = new TurndownService({ headingStyle: 'atx' })
const html = '<h1>Title</h1><p>A <strong>bold</strong> paragraph.</p>'
const md = turndown.turndown(html)
console.log(md)
// → "# Title\n\nA **bold** paragraph."
Python (markdownify)
from markdownify import markdownify
html = '<h2>Section</h2><ul><li>First</li><li>Second</li></ul>'
md = markdownify(html, heading_style='ATX')
print(md)
# → "## Section\n\n- First\n- Second"
Python (html2text)
import html2text
converter = html2text.HTML2Text()
converter.body_width = 0 # disable line wrapping
html = '<p>Visit <a href="https://example.com">Example</a> for details.</p>'
md = converter.handle(html)
print(md)
# → "Visit [Example](https://example.com) for details."
# Convert an HTML file to Markdown
pandoc input.html -f html -t markdown -o output.md
# Pipe HTML from stdin
echo '<p>Hello <em>world</em></p>' | pandoc -f html -t markdown
# → Hello *world*
# Use GitHub-Flavored Markdown output
pandoc input.html -f html -t gfm -o output.md
Vanliga frågor
Vilka HTML-element kan inte konverteras till Markdown?
Markdown saknar motsvarighet för <div>, <span>, <form>, <input>, <iframe> eller element med anpassade CSS-klasser och stilar. De flesta konverterare tar bort dessa taggar och behåller bara den inre texten. Vissa konverterare kan skicka ej stödt HTML vidare oförändrat, vilket är giltigt eftersom Markdown-specifikationen uttryckligen tillåter inline HTML. Om du behöver bevara dessa element konfigurerar du din konverterare att behålla rå HTML i stället för att ta bort den.
Hur konverteras HTML-tabeller till Markdown?
HTML-tabeller mappas till GFM pipe-tabellsyntax: | Rubrik | Rubrik | med en avgränsarrad | --- | --- |. GFM-tabeller stöder inte colspan, rowspan eller formatering på cellnivå. Komplexa tabeller med sammanslagna celler plattas ut, vilket kan förlora strukturell information. För enkla datatabeller är konverteringen förlustfri.
Är konverteringen från HTML till Markdown förlustfri?
Nej. Markdown är en delmängd av HTML, så viss information går alltid förlorad under konverteringen. CSS-klasser, inline-stilar, dataattribut, formulärelement och semantiska taggar som <article> eller <section> saknar Markdown-motsvarighet. Textinnehållet och den grundläggande strukturen (rubriker, listor, länkar, betoning) bevaras korrekt. För de flesta arbetsflöden för dokumentation och innehållsmigrering är de bevarade elementen de som faktiskt spelar roll.
Vad är skillnaden mellan HTML till Markdown och HTML till vanlig text?
HTML till vanlig text tar bort all formatering och producerar rå text utan struktur. HTML till Markdown bevarar dokumentstrukturen: rubriker förblir rubriker, länkar behåller sina URL:er, listor förblir listor och betoning behålls. Markdown-utdata kan renderas tillbaka till HTML med samma logiska struktur.
Kan jag konvertera Markdown tillbaka till HTML?
Ja. Varje Markdown-processor (marked, markdown-it, Python-Markdown, goldmark) konverterar Markdown till HTML. Denna tur-och-returresa är en av anledningarna till att Markdown är populärt: du skriver i ett läsbart format och renderar till HTML för webben. Resan är inte perfekt symmetrisk eftersom HTML till Markdown-konvertering tar bort ej stödda element.
Hur hanterar konverteraren HTML med inline CSS eller JavaScript?
Inline CSS (style-attribut) och <style>-block tas bort under konverteringen eftersom Markdown saknar stylingssyntax. JavaScript (<script>-taggar och händelsehanterare som onclick) tas också bort. Konverteraren extraherar endast dokumentets innehåll och struktur. Det gör HTML till Markdown-konvertering till ett användbart saneringsteg när du importerar opålitligt HTML-innehåll i din dokumentation.
Vilken Markdown-variant ska jag använda för mitt projekt?
Använd GitHub-Flavored Markdown (GFM) om ditt innehåll ska visas på GitHub, GitLab eller de flesta dokumentationsplattformar. Använd CommonMark om du behöver strikt specifikationsefterlevnad och förutsägbar tolkning hos olika renderare. Ursprunglig Markdown är bara relevant för äldre system. GFM är det säkraste standardvalet för de flesta projekt.