függvény

Szöveg első N karakterének kinyerése reguláris kifejezéssel, php-val

Az előző bejegyzésemhez hasonló megoldást mutatok, csak most nem adott számú szót vág le a függvény egy szövegből, hanem karaktereket. Szintén állítható, hogy mi kerüljön a levágott szöveg végére, ha volt mit vágni. És szintén megadható, hogy unicode szövegként legyen-e értelmezve a megadott string. Itt mégis a lényegesebb paramétere a függvénynek a 3. paraméter. Ha egy szövegben pont egy szót kéne ketté vágni, nem biztos, hogy jól mutat. Vegyük példának azt a szöveget, hogy: „Mi ez a foszfor?”. Ennek az első 11 karakterét levágva fixen elég érdekes eredményt kapnánk, ami nem biztos, hogy megengedhető. A következő függvény harmadik paraméterével szabályozható, hogy a szövegben a félbevágott szavakat be kell-e fejezni, vagy esetleg el sem kell kezdeni. Netán nyugodtan meg lehet vágni bárhol. A megoldás most is reguláris kifejezésekkel működik, bár az mb_substr függvényt is használhattam volna.

Függvény

  1. /**
  2.  * Szöveg első N karakterének kinyerése
  3.  *
  4.  * @param int $n Hány karakter kell
  5.  * @param string $str A string, amiből az első N karakter kell.
  6.  * @param bool $wordwrapmod Ha null, akkor szavak közben is megvághatja  szöveget.
  7.  *                                                      Ha true, akkor befejezi a szót, aminek a közepén vágna.
  8.  *                                                      Ha false, akkor el sem kezdi a szót, aminek a közepén vágna.
  9.  * @param bool $unicode Unicode karaktereket is értelmezzen.
  10.  * @param string $more Tetszőleges szöveg, jelölés, ami akkor kerül az eredmény mögé,
  11.  *                                              ha vágni kellett belőle.
  12.  * @return string A levágott első N karakter
  13.  */
  14. function firstNChar($n, $str, $wordwrapmod = null, $unicode = true, $more = ' ...')
  15. {
  16.         $php53 = version_compare(PHP_VERSION, '5.3') >= 0;
  17.         $w = $php53 ? '\w' : ($unicode ? '\p{L}\p{N}' : '\w');
  18.         $W = $php53 ? '\W' :  '^'.$w;
  19.         $x = $b = '';
  20.         if ($wordwrapmod) {
  21.                 $x = '(?(?=['.$w.']+)['.$w.']+)';
  22.         } else if (!is_null($wordwrapmod)) {
  23.                 $b = '(?=['.$W.']+)';
  24.         }
  25.         return preg_replace('~^(?>(.{0,'.(int)$n.'})'.$b.$x.').+$~is'.($unicode ? 'u' : ''), '$1'.$more, $str);
  26. }

Példák

  1. $nl = '<br />'.PHP_EOL;
  2. echo firstNChar(10, "Ez egy szöveg").$nl;
  3. echo firstNChar(10, "Ez egy szöveg", false).$nl;
  4. echo firstNChar(10, "Ez egy szöveg", true).$nl;
  5. echo firstNChar(10, "Ez egy szöveg", null, false).$nl;
  6. echo firstNChar(10, "Ez egy szöveg", null, true, ' <a href="">&raquo;</a>').$nl;

Eredmény

  1. Ez egy szö ...<br />
  2. Ez egy ...<br />
  3. Ez egy szöveg<br />
  4. Ez egy sz� ...<br />
  5. Ez egy szö <a href="">&raquo;</a><br />
Megosztás/Mentés

Szöveg első N szavának kinyerése reguláris kifejezéssel, php-val

A következő függvény az első N darab szót tudja kinyerni egy szövegből. Figyelembe veszi, hogy bár vessző, pont, stb... után szóköz kell, ezt nem mindenki tartja be. Ha egy mondat záródik az N. szó után, akkor a mondatzáró jelet is meghagyja. Egyébként levágja. Az N. szó után, ha az eredmény nem az egész szöveget tartalmazza, tetszőleges karakterlánc kiírható. Alapértelmezetten a három pont. Be lehet kapcsolni, hogy unicode karaktereket is tartalmaz-e a szöveg, vagy sem. Alapértelmezetten true-ra van állítva.

Függvény

  1. /**
  2.  * Szövegből első N szó kinyerése
  3.  *
  4.  * @param int $n Hány szó kell a szöveg elejéről
  5.  * @param string $str A forrás szöveg
  6.  * @param bool $unicode Unicode karakterek lehetnek-e a szövegben.
  7.  * @param string $more Az eredmény szöveg mögé írt karakterlánc, ha az eredmény nem a teljes szöveg.  
  8.  * @return string
  9.  */
  10. function firstNWord($n, $str, $unicode = true, $more = ' ...') {
  11.         $php53 = version_compare(PHP_VERSION, '5.3') >= 0;
  12.         $w = $php53 ? '\w' : ($unicode ? '\p{L}\p{N}' : '\w');
  13.         $W = $php53 ? '\W' :  '^'.$w;
  14.        
  15.         return preg_replace('~^(\s*['.$w.']+'.
  16.                         str_repeat('['.$W.']+['.$w.']+', $n-1).
  17.                         '(?(?=[?!:;.])
  18.                                 [[:punct:]]\s*
  19.                         ))\b(.+)$~isx'.($unicode ? 'u' : ''), '$1'.$more, $str);
  20. }

A függvény elején levő verzió ellenőrzés azért kellett, mert 5.3 -ban már a \w is illeszkedik ékezetes karakterre.

Példák

  1. $nl = '<br />'.PHP_EOL;
  2. echo firstNWord(5, "Ez egy").$nl;
  3. echo firstNWord(5, "Ez egy.").$nl;
  4. echo firstNWord(4, "Ez egy szöveg.Amiből megtartok 4 szót.").$nl;
  5. echo firstNWord(3, "Ez egy szöveg. Amiből megtartok 3 szót.").$nl;
  6. echo firstNWord(5, "Ez egy szöveg,amiből megtartok 5 szót.", true,  ' <a href="#">&raquo;</a>').$nl;
  7. echo firstNWord(5, "Ez egy szöveg,amiből megtartok 5 szót.", false,  ' <a href="#">&raquo;</a>').$nl;

Eredmény

  1. Ez egy<br />
  2. Ez egy.<br />
  3. Ez egy szöveg.Amiből ...<br />
  4. Ez egy szöveg.  ...<br />
  5. Ez egy szöveg,amiből megtartok <a href="#">&raquo;</a><br />
  6. Ez egy szöveg,amib <a href="#">&raquo;</a><br />

Bár a fenti példákra működik a megoldás, nem kizárt, hogy nem tökéletes.

Megosztás/Mentés

Ifsetor és kukac operátor php 5.3 -ban

A PHP 5.3 -ban bevezettek egy nem nagyon hangoztatott operátort. Aminek a függvény alakja az „ifsetor” névre hallgatott volna. Azt viszont elvetették a fejlesztők. Az operátor hasonló a már rég ismert és más nyelvekben is használt ternáris operátorhoz.

echo $x ?: $default;

Gyakorlatilag a következő kód rövidítése:

echo $x ? $x : $default;

Tehát:

  1. $x = 0;
  2. echo $x ?: 20;

Kiírja, hogy 20, mert az $x logikai hamissá konvertálható. De a

  1. $x = 12;
  2. echo $x ?: 20;

Kiírja, hogy 12, mert az $x itt már logikai típusként igaz értéket venne fel.

Persze személy szerint azt hiszem, ezzel kaptunk egy nem túl hasznos, ámde érdekes operátort. Ugyanis erre így nem gyakran van szükség. Talán csak a következő példát tudnám most hirtelen elképzelni:

Megosztás/Mentés

Többdimenziós tömbök értékeinek szelektív lekérdezése php-ban

Az ötletet a különböző keretrendszerekben megtalálható hasonló metódusok adták, amik adatbázisból lekérdezett eredményhalmaz átrendezésére használhatók. A különböző rekordokat egy kétdimenziós tömbben is visszakaphatjuk, ami vagy numerikusan indexelt, vagy valamelyik adott oszlop értéke szerint. Például felhasználó azonosítója. Az összetett kulcsok által indexelésre viszont ezek sem adnak megoldást. Továbbá vannak olyan helyzetek, amikor egy tömbből konkrét indexekhez ( oszlopokhoz ) tartozó értékekre van szükség és csak azokra. Erre talán azt tudnám példaként említeni, amikor egy nem általunk írt függvény az átadott összes tömbelemet feldolgozza. Ezeken túl a következő függvény a nem létező indexekhez tartozó értékeket figyelmen kívül hagyja.

Példa tömb:

  1. $array = array(
  2.         4 => array('id' => 1, 'name' => 'Takács Ákos','age' => 25),
  3.         8 => array('id' => 345, 'name' => 'Kovács Géza', 'age' => 31),
  4.         1 => array('id' => 13, 'name' => 'Tóth Töhötöm', 'age' => 12),
  5.         56 => array('id' => 98, 'name' => 'Teszt Eszter', 'age' => 43)
  6. );

Példa select lista készítéséhez

  1. <?php
  2. $persons = fetch($array, 'name', 'id');
  3. ?>
  4. <select name="persons">
  5. <?php foreach ($persons as $id => $name) : ?>
  6.         <option value="<?php echo (int)$id; ?>"><?php echo htmlspecialchars($name); ?></option>
  7. <?php endforeach; ?>
  8. </select>

Eredmény:

  1. <select name="persons">
  2.         <option value="1">Takács Ákos</option>
  3.         <option value="345">Kovács Géza</option>
  4.         <option value="13">Tóth Töhötöm</option>
  5.         <option value="98">Teszt Eszter</option>
  6. </select>

További példák a használatára:

Megosztás/Mentés