Electronica/Elektronika Wereld / Elektuur

Thevel

Golden Member

De eerste 14 nummers waren geen probleem.

Op 14 maart 2021 22:36:01 schreef Jeever:
[...]
Ik ook niet!

Ook even getest. De .001 en .002 horen bij elkaar (dus wel in zelfde folder houden). Als je met 7-zip het bestand .001 extract, worden de bestanden uit .002 gewoon meegenomen.

Ik kon gewoon alle 24 nummers uitpakken.

Thevel

Golden Member

De .001 en .002 horen bij elkaar (dus wel in zelfde folder houden)

Werkt, bedankt!

bprosman

Golden Member

Het is inderdaad een (1) .zip file die door 7zip in 2 stukken geknipt is vanwege de 2Gb limiet van WeTransfer. Beide bestanden in 1 directory zetten, de eerste openen met 7-zip en dan kun je ze alle 24 uitpakken.

De jongere generatie loopt veel te vaak zijn PIC achterna.

Op 14 maart 2021 21:56:11 schreef flash2b:
Met ... Total Commander gaat het iig niet.

Met 'combine files' maak je van de twee zip-files één zip-file. Gaat als volgt: Selecteer uitsluitend de 1e file (xxx.001) Dan geef je de opdracht "combine file" = "Alt+F m". Dan worden alle files xxx.001 t/m xxx.999 in dezelfde map samengevoegd tot één file xxx. Die file kan je openen of bewerken met de door jouw gewenste applicatie. Zie ook de Help van Total Commander.

Hubie

Special Member

Heb hier 11 jaargangen Radio Bulletin in de boekenkast staan.
Op een regenachtige zondagmiddag trek ik soms zo'n boek uit de kast en sla het 'at random'open.
Alleen die muffe geur al die uit zo'n boek opstijgt,daar krijg ik spontaan nostalgische radio(jeugd) visioenen bij. ;-)
Als er iemand is die ALLE RB's kan verzamelen en wilt scannen wil ik ze wel opofferen.

Jeever

Golden Member

Op 15 maart 2021 01:44:05 schreef Hubie:
Heb hier 11 jaargangen Radio Bulletin in de boekenkast staan.
Als er iemand is die ALLE RB's kan verzamelen en wilt scannen wil ik ze wel opofferen.

Alle RB's van 1937 tot en met 1997 staan als PDF's op:
https://nvhrbiblio.nl/biblio/tijdschrift/Radio%20Bulletin/

[Bericht gewijzigd door Jeever op maandag 15 maart 2021 02:27:26 (27%)

Bezoek mijn elektronica-hobby blog https://verstraten-elektronica.blogspot.com/
Thevel

Golden Member

@Jos en bprosman.
Bedankt voor alle inspanning!

PE was het eerste elektronica blad war ik ooit een abonnement van had. Nu het digitaal voorhanden is ga ik het weer eens fijn doorlezen. :)

joopv

Golden Member

Hartstikke mooi dat dit digitaal beschikbaar is nu, bedankt voor al je werk Bram. Hopelijk ontstaan er geen copyright issues. Ik heb geen idee hoe dit afgedekt is met al die grote gedigitaliseerde tijdschriften verzamelingen her en der op het web.

Wel vind ik het jammer dat die bestanden zo groot zijn. Waarom doet de Canon Imagerunner hier op kantoor maar 12MB voor 70 pagina's A4 en worden deze 100 A5jes 150MB? Heeft dat te maken met de jpeg compressie? Kun je dat ergens instellen?

Ben nu ook samen met Bram de laatste Elektuur (nr 5) uit maart 1962 te digitaliseren. De eigenaar van het tijdschrift heeft het gescant en heeft mij 68 jpeg bestanden gestuurd van 3 - 6MB per stuk. Als je dat bij elkaar knoopt tot een pdf wordt het een pdf bestand van 150MB. De Canon op kantoor zou er een 12MB bestand van maken. Digitaliseerd die met een veel hogere (lossy) compressiefactor? Is dat zichtbaar in het document? Zit er misschien intelligentie in de Canon die tekst, lijnentekeningen en fotomateriaal detecteert en anders opslaat?

Ik weet dat jpeg eigenlijk echt bedoelt is voor fotografisch materiaal, terwijl lijnentekeningen veel beter met lossless png of gif opgeslagen kunnen worden.
En dat je bij het bewerken van jpg's bij het opslaan de lossy compressiefactor gewoon kunt instellen. Op een gegeven moment wordt het zichtbaar en hinderlijk, maar een 6MB jpg kun je best reduceren tot 500K of zo.

Maar goed, je kan ook redeneren dat bandbreedte en opslagcapaciteit zo goedkoop is geworden dat bovenstaande er allemaal niet zo erg toe doet :)

[Bericht gewijzigd door joopv op maandag 15 maart 2021 12:24:27 (13%)

joopv

Golden Member

Op 15 maart 2021 01:44:05 schreef Hubie:
Alleen die muffe geur al die uit zo'n boek opstijgt,daar krijg ik spontaan nostalgische radio(jeugd) visioenen bij. ;-)
.

Ik heb een verzameling van 1300 SF/fantasy boeken weggegeven en er een USB stick voor teruggekregen waar alles op staat in epub'jes. Maar de geur mis ik wel, en het lezen van een fysiek boek is toch wat anders dan een e-reader of smartphone.

Die Meulenhoff bij jou op de foto ken ik volgens mij, die zat er ook bij.

Op 15 maart 2021 12:19:42 schreef joopv:

Wel vind ik het jammer dat die bestanden zo groot zijn. Waarom doet de Canon Imagerunner hier op kantoor maar 12MB voor 70 pagina's A4 en worden deze 100 A5jes 150MB? Heeft dat te maken met de jpeg compressie? Kun je dat ergens instellen?

Je kunt in Acrobat DC "Optimizen". Als ik dat doe met standaard instelling voor het eerste nummer van PE (van 106MB), dan hou ik een bestand van 12 MB over. En ik zie eigenlijk geen verschil, behalve dat het op een trage pc een fractie langzamer open gaat (vanwege de compressie).

Dus bijna 10 keer kleiner in omvang. Datzelfde kan met je Elektuur nr 5 vast ook. Als je me die toestuurt probeer ik het wel even en stuur het terug.

bprosman

Golden Member

Ben nu ook samen met Bram de laatste Elektuur (nr 5) uit maart 1962 te digitaliseren.

Die is klaar en inderdaad (geindexeerd) ongeveer 165Mb , zal eens kijken of ik dat "Optimizen" voor elkaar krijg.
Zojuist hier een Acrobat Distiller licentie gevraagd, eens kijken of ik m krijg.

[Bericht gewijzigd door bprosman op maandag 15 maart 2021 13:01:45 (16%)

De jongere generatie loopt veel te vaak zijn PIC achterna.
flash2b

Special Member

Op 15 maart 2021 00:25:04 schreef ohm pi:
[...]Met 'combine files' maak je van de twee zip-files één zip-file. Gaat als volgt: Selecteer uitsluitend de 1e file (xxx.001) Dan geef je de opdracht "combine file" = "Alt+F m". Dan worden alle files xxx.001 t/m xxx.999 in dezelfde map samengevoegd tot één file xxx. Die file kan je openen of bewerken met de door jouw gewenste applicatie. Zie ook de Help van Total Commander.

Dank je wel, dat wist in niet!

maartenbakker

Golden Member

Op 15 maart 2021 12:40:24 schreef djf:
[...]

Je kunt in Acrobat DC "Optimizen". Als ik dat doe met standaard instelling voor het eerste nummer van PE (van 106MB), dan hou ik een bestand van 12 MB over. En ik zie eigenlijk geen verschil, behalve dat het op een trage pc een fractie langzamer open gaat (vanwege de compressie).

Dus bijna 10 keer kleiner in omvang. Datzelfde kan met je Elektuur nr 5 vast ook. Als je me die toestuurt probeer ik het wel even en stuur het terug.

Als ik zulke cijfers zie dan hou ik m'n hart een beetje vast hoewel het in theorie zou moeten kunnen. Als je de twee nummers eens beschikbaar zou kunnen maken dan zou ik ze graag ook eens vergelijken.

www.elba-elektro.nl | "The mind is a funny thing. Sometimes it needs a good whack on the side of the head to jar things loose."

Op 15 maart 2021 13:35:17 schreef maartenbakker:
[...]Als ik zulke cijfers zie dan hou ik m'n hart een beetje vast hoewel het in theorie zou moeten kunnen. Als je de twee nummers eens beschikbaar zou kunnen maken dan zou ik ze graag ook eens vergelijken.

Ja het is een sterke compressie, en bij flink uitvergroten zie ik wel wat artefacten, maar voor mij acceptabel aangezien het natuurlijk ook gewoon oud drukwerk is en geen fotowerk o.i.d..

Ik heb even een WeTransfer gedaan zodat jij en anderen zelf even kunnen kijken:

Download link https://we.tl/t-qEe19DGntG
of deze: https://wetransfer.com/downloads/234af2b994a7b77db4e772b3249e398620210…

[Bericht gewijzigd door djf op maandag 15 maart 2021 13:56:17 (10%)

echtepino

Golden Member

Wat mij opvalt is dat dit een echte OCR scan is: je kunt de scan doorzoeken op tekst. Dat is een groot pluspunt maar maakt wel dat je meer data vastlegt.
Ik hoop dat je bij het "optimizen" niet alleen plaatjes overhoudt met tekst die je niet meer kunt doorzoeken.

De nieuwe scan is inderdaad alleen van minder grafische kwaliteit maar nog steeds doorzoekbaar op tekst.

Word lid van de Benelux DX Club
flash2b

Special Member

Tekst blijft zoekbaar na compressie. Het voorbeeld ziet er goed uit @djf

Op 15 maart 2021 14:30:40 schreef echtepino:
Wat mij opvalt is dat dit een echte OCR scan is: je kunt de scan doorzoeken op tekst. Dat is een groot pluspunt maar maakt wel dat je meer data vastlegt.
Ik hoop dat je bij het "optimizen" niet alleen plaatjes overhoudt met tekst die je niet meer kunt doorzoeken.

Nee, dat is geen probleem. De tekst is echt maar een heel klein gedeelte van pdf file (ik denk minder dan 1%), dat blijft gewoon intact bij de compressie.

Edit: omdat ik eigenlijk wel nieuwsgierig was even een programmaatje op dit nummer los gelaten. En die telt in de pdf 17.704 woorden en 106.386 karakters. Dus die < 1% (< 120 kB) komt wel aardig in de buurt :)

maartenbakker

Golden Member

En verder zou je de tekst nog tot minder dan 50% kunnen comprimeren met een traditionele Lempel-Ziv.

Het grootste probleem van scanwerk comprimeren zit hem erin dat het best lastig is om precies die stukjes te comprimeren die dat kunnen hebben.

De lompste en meest gebruikte manier is om de bitdiepte (het aantal grijstinten) te reduceren tot 1 (zwart/wit). In combinatie met een te lage resolutie en met wat pech een niet heel erg goed origineel, krijg je dan al snel dat de kleinste lettertjes niet meer zo herkenbaar zijn.

Als ik iets echt zwart/wit wil hebben en niet met nog een paar grijstinten dan doe ik dat handmatig en dat is ook niet ideaal. Als Adobe erin geslaagd is om dat wel echt goed te doen, is dat altijd goed om te weten.

Bij plaatjes zorgt de jpeg compressie voor het verlies van details die in het drukwerk nog wel zichtbaar waren. De extreemste vorm zijn printlayouts waar de sporen gewoon als een soort vlek in elkaar overlopen.

Ik ga deze scans eens goed bekijken, kom ik op terug.

www.elba-elektro.nl | "The mind is a funny thing. Sometimes it needs a good whack on the side of the head to jar things loose."

Op 15 maart 2021 15:29:22 schreef maartenbakker:
En verder zou je de tekst nog tot minder dan 50% kunnen comprimeren met een traditionele Lempel-Ziv.

---knip---

Ik ga deze scans eens goed bekijken, kom ik op terug.

Mooie uitleg.

Als ik zelf even visueel vergelijk dan zie ik vooral verschil in de roze/gele achtergrond van de verkleurde pagina's. En de meetapparatuur foto op pagina 25 zie je de schalen een tikkeltje minder gedetailleerd.
Als je het flink opblaast zie je natuurlijk wel wat verschil in letters en lijnen (printplaten). Als je überhaupt printplaten wilt kopiëren uit de pdf, dan zou ik natuurlijk liever het origineel hebben (maar dat ga ik echt niet doen :) ).

maartenbakker

Golden Member

Ik heb eens goed gekeken. De resolutie en het aantal grijstinten lijken me prima in orde (dat is al driekwart van het verhaal), nauwelijks of geen artefacten, vooral de foto's zijn iets onscherper.

Voor een distributiekopie is dit echt uitstekend. Voor een master/archiefkopie die bewaard wordt in plaats van het papier zou ik eventueel de rauwe scans opslaan. Voor hobbytijdschriften is dat niet echt essentieel, voor fabrieksdocumentatie, sommige vakbladen of zeldzame papieren zou ik dat wel doen.

Een reden daarvoor is dat je van foto's nog vaak types en coderingen kunt aflezen die op het origineel nog net zichtbaar zijn en na compressie niet meer. Hier is dat zoals gezegd niet belangrijk.

[Bericht gewijzigd door maartenbakker op maandag 15 maart 2021 17:07:30 (18%)

www.elba-elektro.nl | "The mind is a funny thing. Sometimes it needs a good whack on the side of the head to jar things loose."
bprosman

Golden Member

Via Acrobat DC (Volgens mij heette dat vroeger Distiller) kun van een PDF een "Compressed" versie aanmaken.

Testje gedaan op PE nummer 1.
https://wetransfer.com/downloads/b1b36eb4672c7a7d336198179dfd885b20210…

En Joop's Elektuur
https://wetransfer.com/downloads/e9e9b08b8d3b0a2fce2263e6bdca107e20210…

Ziet er best goed uit eigenlijk.

[Bericht gewijzigd door bprosman op maandag 15 maart 2021 21:33:31 (20%)

De jongere generatie loopt veel te vaak zijn PIC achterna.

Op 15 maart 2021 02:26:33 schreef Jeever:
[...]
Alle RB's van 1937 tot en met 1997 staan als PDF's op:
https://nvhrbiblio.nl/biblio/tijdschrift/Radio%20Bulletin/

Ben ze nu allemaal aan het downloaden met HTTrack Website Copier. Het schijnt dat het sneller kan met het Linux-commando 'wget', maar zo slim ben ik niet.

Hubie

Special Member

Op 15 maart 2021 12:32:13 schreef joopv:
[...]Ik heb een verzameling van 1300 SF/fantasy boeken weggegeven en er een USB stick voor teruggekregen waar alles op staat in epub'jes. Maar de geur mis ik wel, en het lezen van een fysiek boek is toch wat anders dan een e-reader of smartphone.

Die Meulenhoff bij jou op de foto ken ik volgens mij, die zat er ook bij.

Je bedoelt die zwarte 2e van links?