शब्द गणना क्या है?

एक शब्द काउंटर आपको बताता है कि किसी पाठ में कितने शब्द, वर्ण, वाक्य और अनुच्छेद हैं। यह रिक्त स्थान की सीमाओं पर इनपुट को विभाजित करता है और वाक्य तथा अनुच्छेद पहचान के लिए पैटर्न-आधारित नियम लागू करता है। "शब्द" की परिभाषा भाषा, लिपि और संदर्भ के अनुसार भिन्न होती है। अंग्रेज़ी में, रिक्त स्थान से विभाजित खंड उचित रूप से काम करते हैं। CJK भाषाओं (Chinese, Japanese, Korean) में शब्दों के बीच रिक्त स्थान नहीं होता, और विभाजन के लिए ICU के BreakIterator जैसे शब्दकोश-आधारित एल्गोरिदम आवश्यक होते हैं।

वर्ण गणना की दो सामान्य परिभाषाएँ हैं: रिक्त स्थान सहित और रिक्त स्थान रहित। कुल वर्ण गणना में पाठ के प्रत्येक Unicode कोड पॉइंट शामिल हैं, जिनमें रिक्त स्थान, टैब और नई पंक्ति वर्ण भी आते हैं। रिक्त स्थान रहित गणना में गिनती से पहले सभी रिक्त स्थान हटा दिए जाते हैं। यह वही मापदंड है जिसे Twitter (अब X) पोस्ट की लंबाई सीमा और अनुवादक प्रति वर्ण शुल्क के लिए उपयोग करते हैं। यह अंतर तब महत्त्वपूर्ण होता है जब आप किसी ऐसी प्रणाली में पाठ चिपकाते हैं जिसमें कड़ी लंबाई की सीमाएँ हों।

पढ़ने के समय और बोलने के समय का अनुमान शब्द संख्या को औसत गति से विभाजित करके लगाया जाता है। Journal of Memory and Language (Brysbaert, 2019) में प्रकाशित शोध के अनुसार अंग्रेज़ी गद्य के मौन पाठन की औसत गति 238 शब्द प्रति मिनट है। प्रस्तुति के लिए बोलने की गति सामान्यतः 130 से 160 शब्द प्रति मिनट होती है। ये औसत पाठ की कठिनाई, पाठक वर्ग और भाषा के अनुसार भिन्न हो सकते हैं, किन्तु ब्लॉग पोस्ट, दस्तावेज़ीकरण और स्लाइड डेक के लिए एक व्यावहारिक अनुमान प्रदान करते हैं।

यह Word Counter क्यों उपयोग करें?

अपना टेक्स्ट चिपकाएँ और बिना खाता बनाए या नेटवर्क पर डेटा भेजे तुरंत शब्द, वर्ण, वाक्य और अनुच्छेद की संख्या प्राप्त करें।

⚡

तत्काल परिणाम

टाइप करते या चिपकाते ही गणना अपडेट हो जाती है। कोई बटन दबाने की ज़रूरत नहीं, कोई लोडिंग नहीं। एक के बाद एक भिन्न पाठ बिना किसी देरी के परखें।

🔒

गोपनीयता-केंद्रित प्रोसेसिंग

सभी गणना JavaScript का उपयोग करके आपके ब्राउज़र में होती है। आपका टेक्स्ट आपके डिवाइस से बाहर नहीं जाता और किसी सर्वर पर कुछ भी संग्रहीत या लॉग नहीं होता।

📊

एक साथ सात मापदंड

शब्द, वर्ण (रिक्त स्थान सहित और रहित), वाक्य, अनुच्छेद, पढ़ने का समय और बोलने का समय — एक बार चिपकाने पर आपको सब कुछ मिल जाता है।

🌍

कोई खाता या इंस्टॉलेशन आवश्यक नहीं

पेज खोलें और गणना शुरू करें। कोई साइनअप नहीं, कोई ब्राउज़र एक्सटेंशन नहीं, कोई डेस्कटॉप एप्लिकेशन नहीं। आधुनिक ब्राउज़र वाले किसी भी डिवाइस पर काम करता है।

Word Counter के उपयोग के अवसर

सामग्री लेखन और ब्लॉगिंग

SEO लक्ष्यों के अनुसार लेख की लंबाई जाँचें। Google न्यूनतम शब्द संख्या लागू नहीं करता, किन्तु Backlinko और Ahrefs के अध्ययनों से पता चलता है कि प्रतिस्पर्धी खोज प्रश्नों के लिए शीर्ष-रैंकिंग पृष्ठों पर औसतन 1,400 से 1,700 शब्द होते हैं।

API दस्तावेज़ीकरण

एंडपॉइंट विवरणों को सुसंगत रखें। यदि आपकी स्टाइल गाइड कहती है कि प्रत्येक पैरामीटर विवरण 200 वर्णों से कम होना चाहिए, तो कमिट करने से पहले यहाँ टेक्स्ट चिपकाकर जाँच लें।

शैक्षणिक शोधपत्र तैयारी

सम्मेलन प्रस्तुतियों और शोध पत्रिकाओं में शब्द सीमाएँ कठोर होती हैं। अधिकतम सीमा से अधिक होने पर अस्वीकृति से बचने के लिए जमा करने से पहले शब्द गिनें।

सोशल मीडिया पोस्ट का मसौदा

Twitter/X में 280 वर्ण की सीमा है, LinkedIn पोस्ट 3,000 वर्ण पर कट जाती है, और Meta विज्ञापन शीर्षक 40 वर्ण तक सीमित हैं। प्रकाशित करने से पहले वर्ण संख्या जाँचें।

DevOps कमिट संदेश

पारंपरिक Git कमिट संदेश प्रारूप विषय पंक्ति को 50 वर्णों से कम और मुख्य भाग को प्रति पंक्ति 72 वर्णों तक सीमित रखने की सलाह देता है। कमिट करने से पहले मसौदा यहाँ चिपकाकर जाँच लें।

अनुवाद और स्थानीयकरण

अनुवादक शब्द या वर्ण संख्या के आधार पर शुल्क लेते हैं। किसी अनुवाद एजेंसी को फ़ाइलें भेजने से पहले स्रोत टेक्स्ट की सटीक गणना प्राप्त करें ताकि उद्धरण माँग सकें और परियोजना लागत का अनुमान लगा सकें।

टेक्स्ट मापदंड संदर्भ

यह उपकरण जो प्रत्येक मापदंड रिपोर्ट करता है उसकी एक विशिष्ट परिभाषा है। नीचे दी गई तालिका दर्शाती है कि प्रत्येक की गणना कैसे होती है।

मापदंड	गणना का तरीका	उदाहरण
Words	Sequences separated by whitespace	"hello world" → 2
Characters	All characters including spaces	"hi there" → 8
Characters (no spaces)	Letters, digits, punctuation only	"hi there" → 7
Sentences	Segments ending with . ? or !	"Hi. Bye!" → 2
Paragraphs	Text blocks separated by blank lines	"A\n\nB" → 2
Reading time	Word count ÷ 238 wpm (silent reading avg)	1 000 words → ~4.2 min
Speaking time	Word count ÷ 150 wpm (presentation pace)	1 000 words → ~6.7 min

शब्द संख्या बनाम वर्ण संख्या

ये दोनों मापदंड भिन्न प्रश्नों के उत्तर देते हैं। गलत मापदंड चुनने से प्रस्तुतियाँ अस्वीकृत हो सकती हैं या लेआउट बिगड़ सकता है।

शब्द संख्या

रिक्त स्थान से विभाजित खंडों की संख्या मापता है। यह निबंधों, लेखों और पुस्तक पांडुलिपियों के लिए मानक मापदंड है। अधिकांश शैक्षणिक पत्रिकाएँ, ब्लॉगिंग प्लेटफ़ॉर्म और स्वतंत्र अनुबंध लंबाई शब्दों में परिभाषित करते हैं। यह भाषा-निर्भर है: 500-शब्द अंग्रेज़ी अनुच्छेद का जर्मन में 700 शब्द या चीनी में 300 वर्णों में अनुवाद हो सकता है।

वर्ण संख्या

प्रत्येक वर्ण (Unicode कोड पॉइंट) की संख्या मापता है। यह सोशल मीडिया सीमाओं (Twitter: 280 वर्ण), SMS संदेशों (GSM-7 में 160 बाइट), UI स्ट्रिंग और CJK टेक्स्ट के लिए मानक है जहाँ शब्द सीमाएँ नहीं होतीं। जब कोई प्लेटफ़ॉर्म "वर्ण सीमा" कहता है, तो उनका आशय सामान्यतः कोड पॉइंट से होता है, बाइट से नहीं। सरोगेट युग्म (इमोजी, कुछ CJK) प्लेटफ़ॉर्म के अनुसार 1 या 2 गिने जा सकते हैं।

कोड उदाहरण

भिन्न भाषाओं में शब्दों और वर्णों को प्रोग्रामेटिक रूप से कैसे गिनें। प्रत्येक उदाहरण सुसंगत तुलना के लिए एक ही इनपुट स्ट्रिंग का उपयोग करता है।

JavaScript

// Word count — split on whitespace, filter empty strings
const text = 'Hello  world!  How are you?'
const words = text.trim().split(/\s+/).filter(Boolean)
console.log(words.length) // → 5

// Character count
console.log(text.length)                          // → 27 (with spaces)
console.log(text.replace(/\s/g, '').length)       // → 22 (without spaces)

// Sentence count — split on sentence-ending punctuation
const sentences = text.split(/[.!?]+/).filter(s => s.trim().length > 0)
console.log(sentences.length) // → 2

// Reading time estimate (238 wpm average)
const readingMin = words.length / 238
console.log(Math.ceil(readingMin)) // → 1 min

Python

import re

text = 'Hello  world!  How are you?'

# Word count
words = text.split()
print(len(words))  # → 5

# Character counts
print(len(text))                              # → 27 (with spaces)
print(len(text.replace(' ', '')))             # → 22 (without spaces)

# Sentence count
sentences = [s for s in re.split(r'[.!?]+', text) if s.strip()]
print(len(sentences))  # → 2

# Paragraph count
multiline = """First paragraph.

Second paragraph."""
paragraphs = [p for p in multiline.split('\n\n') if p.strip()]
print(len(paragraphs))  # → 2

package main

import (
	"fmt"
	"strings"
	"unicode"
)

func main() {
	text := "Hello  world!  How are you?"

	// Word count
	words := strings.Fields(text)
	fmt.Println(len(words)) // → 5

	// Character count (rune-aware for Unicode)
	fmt.Println(len([]rune(text))) // → 27

	// Characters without spaces
	noSpaces := strings.Map(func(r rune) rune {
		if unicode.IsSpace(r) {
			return -1
		}
		return r
	}, text)
	fmt.Println(len([]rune(noSpaces))) // → 22
}

CLI (bash)

# Word count
echo "Hello world" | wc -w
# → 2

# Character count (bytes — use wc -m for multibyte chars)
echo -n "Hello world" | wc -m
# → 11

# Line count
echo -e "line1\nline2\nline3" | wc -l
# → 3

# Count words in a file
wc -w < article.txt
# → 4230

अक्सर पूछे जाने वाले प्रश्न

शब्द काउंटर "शब्द" को कैसे परिभाषित करता है?

यह उपकरण टेक्स्ट को रिक्त स्थान (स्पेस, टैब, नई पंक्ति) पर विभाजित करता है और परिणामी गैर-रिक्त खंड गिनता है। "well-known" जैसे हाइफ़न युक्त पद एक शब्द माने जाते हैं। यह अंग्रेज़ी टेक्स्ट के लिए Microsoft Word और Google Docs के व्यवहार से मेल खाता है। CJK भाषाओं के लिए, रिक्त स्थान-आधारित विभाजन वास्तविक शब्द संख्या को कम आँकता है क्योंकि उन लिपियों में शब्दों के बीच रिक्त स्थान नहीं होता।

क्या पढ़ने के समय का अनुमान सटीक है?

यह अनुमान Marc Brysbaert के 2019 के मेटा-विश्लेषण पर आधारित है — जिसमें 190 अध्ययन शामिल थे — और 238 शब्द प्रति मिनट की औसत गति मानता है। यह वयस्कों द्वारा अंग्रेज़ी गैर-कथा गद्य के मौन पाठन के लिए अच्छा औसत है। कोड ब्लॉक वाला तकनीकी दस्तावेज़ीकरण धीमे पढ़ा जाता है (150 से 180 शब्द प्रति मिनट), और सामान्य ब्लॉग सामग्री तेज़ (250 से 300 शब्द प्रति मिनट)। इस संख्या को एक मार्गदर्शक मानें, गारंटी नहीं।

वर्ण और रिक्त स्थान रहित वर्ण में क्या अंतर है?

वर्ण में पाठ का प्रत्येक वर्ण शामिल है: अक्षर, अंक, विराम चिह्न, रिक्त स्थान, टैब और नई पंक्ति। रिक्त स्थान रहित वर्ण में गणना से पहले सभी रिक्त स्थान हटा दिए जाते हैं। Twitter जैसे प्लेटफ़ॉर्म की सीमाएँ जाँचते समय "रिक्त स्थान रहित" गणना उपयोग करें जहाँ रिक्त स्थान सीमा में गिने जाते हैं, या CJK भाषाओं में अनुवाद मूल्य निर्धारण के लिए जहाँ रिक्त स्थान लेखन प्रणाली का भाग नहीं हैं।

वाक्य कैसे गिने जाते हैं?

यह उपकरण उन खंडों को गिनता है जो पूर्ण विराम, विस्मयादिबोधक चिह्न या प्रश्नवाचक चिह्न से समाप्त होते हैं। "Dr." या "U.S.A." जैसे संक्षिप्ताक्षर संख्या बढ़ा सकते हैं क्योंकि प्रत्येक पूर्ण विराम एक मिलान उत्पन्न करता है। सटीक वाक्य विभाजन के लिए spaCy या NLTK जैसी NLP लाइब्रेरी उपयोग करें जो संक्षिप्ताक्षरों, दीर्घ विरामों और दशमलव संख्याओं के लिए प्रशिक्षित मॉडल लागू करती हैं।

क्या मैं बिना चिपकाए किसी फ़ाइल में शब्द गिन सकता हूँ?

यह ब्राउज़र उपकरण केवल चिपकाए गए टेक्स्ट के साथ काम करता है। कमांड लाइन से किसी फ़ाइल में शब्द गिनने के लिए, Linux या macOS पर wc -w filename उपयोग करें। Windows पर PowerShell में (Get-Content file.txt | Measure-Object -Word).Words उपलब्ध है। बड़ी फ़ाइलों या बैच प्रोसेसिंग के लिए कमांड-लाइन उपकरण किसी भी ब्राउज़र-आधारित काउंटर से तेज़ होते हैं।

क्या यह उपकरण Unicode वर्ण सही तरीके से गिनता है?

हाँ। JavaScript की string.length UTF-16 कोड यूनिट गिनती है, कोड पॉइंट नहीं, इसलिए एक ध्वज (जो कई कोड पॉइंट के ZWJ अनुक्रम से बना है) जैसे एकल इमोजी से अपेक्षा से अधिक वर्ण संख्या रिपोर्ट हो सकती है। यह उपकरण ब्राउज़र की अंतर्निर्मित स्ट्रिंग API जैसी ही गणना पद्धति उपयोग करता है। सटीक ग्राफ़ीम क्लस्टर गणना के लिए आधुनिक ब्राउज़रों में उपलब्ध Intl.Segmenter API उपयोग करें।

यह Microsoft Word या Google Docs के शब्द काउंटर से कैसे भिन्न है?

Microsoft Word और Google Docs अंग्रेज़ी शब्द गणना के लिए समान रिक्त स्थान-आधारित विभाजन उपयोग करते हैं। हाइफ़न युक्त शब्दों, रिक्त स्थान रहित em डैश और पादटिप्पणियाँ या शीर्षकों को शामिल करने के तरीके में मामूली अंतर हो सकता है। यह उपकरण आपके द्वारा चिपकाए गए टेक्स्ट को बिना किसी मेटाडेटा, शीर्षक या पादटिप्पणी के गिनता है। किसी विशेष प्लेटफ़ॉर्म की गणना से सटीक मिलान के लिए, दोनों में एक ही टेक्स्ट चिपकाएँ और तुलना करें।

Word Counter