branje iz datoteke c# @ Slo-Tech

Forum » Programiranje »
branje iz datoteke c#

branje iz datoteke c#

bigbada :: 28. feb 2011, 16:25

using System;
using System.Collections.Generic;
using System.ComponentModel;
using System.Data;
using System.Linq;
using System.Text;
using System.IO;
using System.Text.RegularExpressions;
namespace Vaja1
{
    class Program
    {
        static void Main(string[] args)
        {
            string datoteka;
            while (true) 
            {
                Console.Write("Ime datoteke: ");
                datoteka = Console.ReadLine();
                if (File.Exists(datoteka))
                    break; 
                else Console.WriteLine("Datoteka s tem imenom ne obstaja!");
            }
            FileStream fs = new FileStream(datoteka, FileMode.Open, FileAccess.Read);
            
            StreamReader textIn = new StreamReader(fs);
            int znakov = 0;
            int besed = 0;
            while (textIn.Peek() != -1) 
            {
                string stavek = textIn.ReadLine(); 
                znakov = znakov + stavek.Length; 
            }
            textIn.Close(); 
            Console.WriteLine("Skupno število znakov v datoteki: " + znakov);
            Console.WriteLine("Skupno število besed v datoteki: " + besed);
            Console.ReadKey();

        }
    }
}

Moram narediti, da iz datoteke prebere število znakov in število besed. Za znake mi je nekako uspelo. Za besede pa nevem kako se naj lotim. Oz. kako naj preštejem besede.. Vejice in pike nadomestim s presledki, potem pa bi nekako moral prebrati do vsakega presledka in naprej.. Moram pa uporabiti metodo split in razred RegeX..
Any help?

hvala

spremenilo: bigbada (28. feb 2011 ob 16:33)

Kekec :: 28. feb 2011, 17:16

http://www.dotnetperls.com/word-count

Mitja Bonča :: 28. feb 2011, 18:21

Dober primer - to je to.

bigbada :: 28. feb 2011, 22:34

@"[\S]+" v tem primeru odstrani presledke.. vse kar ni presledek kao. Vejic pa ne odstrani in jih kar zraven šteje kot besede.. hmm

Zgodovina sprememb…

spremenilo: bigbada (28. feb 2011 ob 22:40)

keworkian :: 28. feb 2011, 23:08

Ali pa uporabiš tale regex, meni je delal.

@"[^,.\s\?]+"

bigbada :: 1. mar 2011, 00:32

Mogoče kdo ve kako je reg.izraz za vse črke in še ŠUMNIKE.
Poskusil sem @"[A-Za-z0-9]" in @"[A-Za-z0-9čČšŠžŽ]" pa ne gre. Ne najde mi šumnikov...

bigbada :: 1. mar 2011, 12:35

Sem ze resil. Zanima me kako bi naredil, da bi mi iz ene datoteke(besede2.txt) prebralo vse besede in potem prebralo drugo datoteko(besede1.txt) in pogledalo, če se v njej nahajajo iste besede?

besede1.txt
blabla
avto
krneki
krneki
miza
miza

besede2.txt
avto
miza

Potem bi mi izpisalo, katere besede so iste in koliko jih je:
izpis:
avto 1
miza 2

Prosim za kanček pomoči, ker mi nikakor ne uspe niti začet. Najlazje je narediti z metodo .Matches, samo nevem kako.

Niron :: 1. mar 2011, 13:35

Tudi jaz se zafrkavam s tem. Če ti kaj uspe naredit, please share with us!

dolenc :: 1. mar 2011, 15:09

Idejno rešiš takole, dva readerja en bere eno datoteko en drugo.
Potem potrebuješ dve zanki, while bo uredu, ki preletita datoteki in sicer tako, greš v prvo, prebereš prvo besedo in prevrtiš drugo datoteko, če je beseda v prvi enaka besedi v drugi, povečaš nek števec in če je števec večji od 0, to besedo izpišeš in njen števec(da dobiš željeni izpis), potem se v prvi datoteki premakneš na drugo besedo in ponoviš postopek. Se pravi za vsako besedo v prvi preletiš vse besede v drugi in na koncu izpisuješ če imaš kaj. Zdej al boš primerjaj beseda1 = beseda2 ali pa uporabil matches je pa čisto po-željno.

bigbada :: 1. mar 2011, 19:04

Hmm ja ideja zveni kul, vendar je problem, da recimo ima prva datoteka AVTO, AVTO.
v drugi pa je vpisano AVTO

Torej se nahaja vendar ne morem preverjati, ker AVTO, != AVTO .. Verjetno bi moral vse vejice in pike nadomestiti s presledki? Ali kako?

keworkian :: 1. mar 2011, 20:01

A se besede v prvi datoteki ponavljajo?

ok nvm se ponavljajo.

Zgodovina sprememb…

spremenil: keworkian (1. mar 2011 ob 20:02)

bigbada :: 1. mar 2011, 20:03

Ja

Evo datoteka z besedilom

PRODAM DVA PRAŠIČA. Tel. 02/682-67-41. (OJ34526/21/1)

PRODAM PRAŠIČA 200 KG, domače reje. Zg. Duplek. Tel. 02/681-0211. (OJ34529/21/1)

PRAŠIČE DOMAČE REJE, težke ca. 170-180 kg, prodam. Možnost kolin. Tel. 02/629-2250, 041 262 546. (OJ34531/21/1)

PRODAM PRAŠIČE 100-140 kg. Cena 1,30 EUR/kg in cisterno Creina 3200 l. Tel. 031 754-973. (OJ34534/21/1)

230 DELO

231 DOBI

Druga datoteka z besedami, ki se iščejo v prvi

PRODAM 
cisterno
KG

PRODAM mora najti 4x
kg 4x
cisterno 1x

Zgodovina sprememb…

spremenilo: bigbada (1. mar 2011 ob 20:05)

keworkian :: 1. mar 2011, 20:25

Izvoli je napisan uber češko samo se mi ni dalo preveč komplicirat z raznim UTF-8 sranjem.

PS: pozabil še izpis!!!

using System;
using System.Collections.Generic;
using System.Linq;
using System.Text;
using System.IO;
using System.Text.RegularExpressions;

namespace wordcompare
{
    class Program
    {
        static string dat = @"c:\vaja\compare\besede1.txt";
        static string dat2 = @"c:\vaja\compare\besede2.txt";
        static string regex = @"\w+";

        static void Main(string[] args)
        {
            string vals = File.ReadAllText(dat);
            string vals2 = File.ReadAllText(dat2);

            MatchCollection m1 = Regex.Matches(vals, regex);
            MatchCollection m2 = Regex.Matches(vals2, regex);

            Dictionary<string, int> w = new Dictionary<string, int>();

            for (int i = 0; i < m1.Count; i++)
            {
                for (int j = 0; j < m2.Count; j++)
                {
                    if (m1[i].Value.ToLower() == m2[j].Value.ToLower())
                    {
                        if (!w.ContainsKey(m1[i].Value.ToLower()))
                        {
                            w.Add(m1[i].Value.ToLower(), 1);
                        }
                        else
                        {
                            w[m1[i].Value.ToLower()] += 1;
                        }
                    }
                }
            }

            foreach (KeyValuePair<string, int> item in w)
            {
                Console.WriteLine("{0} {1}", item.Key, item.Value);
            }

            Console.ReadLine();
            
        }
    }
}

Zgodovina sprememb…

spremenil: keworkian (1. mar 2011 ob 20:28)

bigbada :: 1. mar 2011, 21:00

Hvala, a lahko še samo poveš, kaj pomeni regularni izraz @"\w+" ?

darkolord :: 1. mar 2011, 21:22

Malo manj češko:

string vals = File.ReadAllText(@"c:\vaja\compare\besede1.txt");
string vals2 = File.ReadAllText(@"c:\vaja\compare\besede2.txt");

var besede = vals.ToLower().Split(" ,.!?\r\n".ToCharArray());
var besede2 = vals2.ToLower().Split(" ,.!?\r\n".ToCharArray());

var w = besede.Where(b => besede2.Contains(b)).GroupBy(b => b); 

foreach (var item in w)
{
	Console.WriteLine("{0} {1}", item.Key, item.Count());
}
 
Console.ReadLine();

Zgodovina sprememb…

spremenilo: darkolord (1. mar 2011 ob 21:22)

Vredno ogleda ...

	Tema	Sporočila	Ogledi	Zadnje sporočilo
	Tema	Sporočila	Ogledi	Zadnje sporočilo
»	c# seminarska tuned Oddelek: Programiranje	11	3458 (3131)	tuned 25. mar 2014 13:58:39
»	[c#] Majhen problemček Cvenemir Oddelek: Programiranje	10	1317 (1125)	darkolord 7. nov 2012 12:30:36
»	[c#] Ustvarjanje objekta v drugem razredu Cvenemir Oddelek: Programiranje	8	1960 (1905)	Cvenemir 19. apr 2012 00:22:36
»	Štetje besed v nizu (C#) Cvenemir Oddelek: Programiranje	5	1311 (1249)	Spura 4. dec 2011 17:29:31
»	[c] Enaki datoteki Zlatan Oddelek: Programiranje	7	1326 (1186)	Spura 21. jun 2010 08:52:52

Več podobnih tem

Zadnje novice

Zadnji članki

Išči:

Forum » Programiranje »
branje iz datoteke c#

branje iz datoteke c#