Ne, Apple nezaplatil za iPhone, aby byl lepší benchmark

Geekbench 6 je nejnovější benchmark v sérii.

AppleInsider může získat přidruženou provizi za nákupy uskutečněné prostřednictvím odkazů na našich stránkách.

Obvinění, že Apple zaplatil vývojářům benchmarků, aby jeho iPhone mohl porazit nejnovější modely Samsungu, jsou nepodložená a jsou založena na tribalismu. Zde je důvod.

Stížnosti sociálních médií na to, že Samsung S23 Ultra si po představení Geekbench 6 vede hůř než iPhone, vedly k obviněním ze zaujatosti ve prospěch Applu. Ve skutečnosti je to jen otázka toho, jak jsou benchmarky vnímány jako absolutní hodnota smartphonu.

Od únorového představení Geekbench 6 si fanoušci Samsungu a Androidu stěžovali na Twitter a další veřejná fóra, aby si stěžovali na jeho výsledky. Konkrétně jde o to, jak se Samsung Galaxy S23 Ultra hodnotí v porovnání s řadou iPhone 14 Pro.

Kompilace poplatků podle PhoneArena uvádí stížnosti především na to, jak se skóre dále vzdalovalo s představením nového Geekbench 6.

V rámci Geekbench 5 by Galaxy S23 Ultra získal přibližně 1 600 za jednojádrové skóre a 5 000 za vícejádrové, v souhvězdí iPhone 14 Pro 1 900 a 5 500 skóre.

Údaje Ballpark pro výsledky v rámci Geekbench 5

Při testování pomocí Geekbench 6 by Galaxy S23 Ultra zvládl přibližně 1 900 pro jednojádrový test a 5 100 pro vícejádrový test. Mezitím iPhone 14 Pro spravuje 2 500 pro jednojádrový výsledek a 6 500 pro vícejádrový.

Všimněte si většího rozdílu ve skóre pro výsledky v Geekbench 6 ballpark.

Ve skutečnosti je iPhone o 18 % lepší v jednojádrovém a o 10 % lepší ve vícejádrovém než Samsung pod Geekbench 5. Přechodem na Geekbench 6 se náskok zvýšil na 31 %, respektive 18 %.

Samsung Galaxy S23 Ultra

Obyvatelé sociálních sítí tvrdí, že tato změna skóre musí znamenat, že je ve hře nějaká zaujatost vůči Applu. Přiměřeně těsný závod v Geekbench 5 by měl být stejně těsný i v Geekbench 6, tvrdí tweety.

Proto u těchto lidí existuje určitá míra zaujatosti pro Apple. Jako téměř vždy, někdo již obvinil Apple, že zaplatil GeekBench, aby zvýšil výsledky.

Hra se změnila

První věc, kterou je třeba zvážit, je to, co jde do samotného benchmarku. Syntetický benchmark provádí řadu testů s výsledky sestavenými do konečného, jedinečného skóre.

Tyto testy se po celou dobu životnosti generace benchmarků nemění. Existuje tedy určitá úroveň konzistence v testování mezi zařízeními po dlouhou dobu.

Srovnávací nástroje se však musí čas od času aktualizovat, aby odpovídaly trendům v hardwarových specifikacích a typu úkolů, které může uživatel očekávat se svými zařízeními.

Vydání Geekbench 6 udělalo přesně toto, se změnami stávajících testů a zavedením nových testů, aby lépe odpovídaly tomu, co je možné s moderním zařízením. To zahrnuje nové testy, které se zaměřují na strojové učení a rozšířenou realitu, což jsou oblasti značného růstu v oblasti výpočetní techniky.

„Tyto testy jsou precizně vytvořeny tak, aby zajistily, že výsledky budou reprezentovat skutečné případy použití a pracovní zátěž,“ píše se v popisu Geekbench 6.

Strojové učení je oblast růstu a je schopna tvořit

Strojové učení je oblast růstu a je schopné vytvářet „umění“, takže přesunutí zaměření benchmarku tímto směrem dává smysl.

Představte si to jako závod mezi sprinterem a někým do parkouru. Závod může být normálně něco jako běh na 100 metrů, na který je sprinter zvyklý, ale změna na něco jako překážková dráha Tough Mudder pravděpodobně skončí jiným výsledkem.

Pokud si z tohoto dílu neodnesete nic jiného, zde je hlavní odrážka. Pokud změníte to, co se testuje, výsledky se samozřejmě budou lišit.

Není to nic jiného, než kdybyste porovnali výsledky Geekbench 5 s výsledky jiných benchmarkových sad. Vzhledem k tomu, že existují různé testy a alternativní vážení každého z nich do konečného skóre, najdete rozdíly ve výkonu mezi zařízeními a liší se také mezi srovnávacími nástroji.

Pokud si myslíte, že Geekbench 6 je zcela odlišný nástroj pro srovnávání než Geekbench 5, rozdíly ve výkonu mohou být rozumnější k pochopení.

Ano, změna váhy, aby některé oblasti byly pro skóre důležitější než jiné, může způsobit změnu skóre. Ale pokud to neovlivní možnost přímého srovnání skóre s ostatními ze stejné generace aplikace, není to ve skutečnosti problém.

Potřeba důvěry

Benchmarkové nástroje mají privilegované postavení v tom, že jsou subjektem, který zcela spoléhá na důvěru uživatelů, že výsledky, které poskytují, jsou pravdivé. Vývojáři říkají, že nástroj provede sadu známých testů, které budou pokaždé provedeny určitým způsobem.

Celkově vzato, benchmarkové nástroje prospívají této důvěryhodnosti, že ve hře není žádná specifická zaujatost společnosti. Výsledky, které vyjdou, jsou považovány za legitimní a že vůbec nejde o žádnou nečestnou hru.

Pokud by hypoteticky byl vývojáři benchmarků nabídnut obrovský pytel peněz, aby hodil výsledky ve prospěch jednoho výrobce, bylo by možné toho dosáhnout. Až na to, že rozdíl ve výsledku ve srovnání se zbytkem odvětví benchmarkingu pravděpodobně a náhle způsobí, že uživatelé budou zpochybňovat výsledky, které test přináší.

Taková situace naruší důvěru ve výsledky benchmarkového nástroje, protože ostatní výsledky budou zpochybněny.

Vývojáři benchmarků proto potřebují snížit jakékoli zkreslení výsledků testů, aby mohly být co nejpřesnější, aby si zachovali důvěryhodnost a důvěru, kterou si vybudovali.

Počkejte horkou minutu nebo dvě

Tato důvěryhodnost se formuje, což může být zpočátku pro benchmarkové nástroje problém.

Po roce provozu mohou nástroje jako Geekbench vytvořit kolekci výsledků, na které se uživatelé mohou odkazovat. Vzhledem k tomu, že Geekbench 5 je tak hojně využíván médii a nadšenci, je tato sbírka nesmírně důležitá.

Jak jsme však diskutovali, Geekbench 6 není Geekbench 5 a je venku jen pár týdnů. Zatím si nevybudoval takový katalog výsledků, aby bylo možné adekvátně umožnit srovnání mezi širokým spektrem zařízení.

Postupem času Geekbench 6 dožene velikost katalogu výsledků Geekbench 5.

Bohužel to znamená, že se lidé budou snažit porovnávat výsledky Geekbench 6 s Geekbench 5, dokud nebude tento katalog dostatečně podrobný, aby na tom záleželo.

Toto je problém, který nebude vyřešen okamžitě, protože se spoléhá na výsledky shromážděné z milionů testů pomocí tohoto nástroje. To může trvat měsíce, než vznikne, rozhodně ne dva týdny, které uplynuly od vydání samotného Geekbench 6.

Počkejte pár měsíců a pak se podívejte na benchmarky. Pokud je Geekbench 6 důvěryhodný, uvidíte stejný druh trendů ve všech zařízeních, která testuje.

Varování z historie

S benchmarky, které jsou považovány za hlavní způsob, jak porovnat jedno zařízení s druhým, to může vést k tomu, že si někteří myslí, že je to konečný arbitr toho, jaký je nejlepší smartphone, který si můžete koupit.

Jak jsme právě uvedli, benchmark by měl být pouze malou částí vašeho celkového nákupního rozhodnutí, nikoli jeho celým. Toto upřednostňování benchmarků jako „nejdůležitější věci“ již v minulosti vedlo k podivným situacím.

Vezměte si příklad zpráv z března 2022, kdy byl Samsung přistižen při úpravě fungování jeho zařízení konkrétně s ohledem na benchmarky.

Řada Samsung Galaxy S21 byla dohnána do škrtícího skandálu zahrnujícího benchmarky.

Aby smartphony fungovaly v pohodě a bez problémů, může se výrobce smartphonů rozhodnout omezit kapacitu zpracování svých zařízení. To dává smysl do určité míry, protože rozžhavený smartphone není pro spotřebitele žádoucí ani ten, který může vybíjet baterii.

V té době byl Samsung přistižen, jak podrobil dlouhý seznam aplikací „výkonovým limitům“, konkrétně je omezoval právě z takového důvodu. Až na to, že benchmarkové aplikace jako Geekbench 5 a Antutu nebyly vůbec omezeny a běžely bez omezení.

Pro koncového uživatele by to znamenalo, že se zařízení bude testovat dobře, ale při skutečném používání by nakonec fungovalo na mnohem nižší úrovni výkonu, než se očekává u mnoha běžných aplikací.

To účinně snižuje koncového uživatele tím, že je nutí věřit, že zařízení běží rychleji než ve skutečnosti, alespoň podle benchmarků.

Benchmarky nejsou skutečný svět

Celý bod benchmarku je v tom, že vám poskytuje standardizovaný způsob, jak porovnat jedno zařízení s druhým a obecně poznat rozdíl ve výkonu. Klíčem je standardizace a stejně jako mnoho oblastí života nemusí nutně vést ke skutečnému odrazu schopností něčeho.

Tato specializace jde dokonce až ke konkrétnímu benchmarku samotnému, protože zatímco Geekbench je více zobecněný, existují i jiné, které mají na mysli konkrétní publikum.

Mnoho hráčů se například spoléhá na benchmarky ve hře, jako je ten in Rise of the Tomb Raider. To dává smysl jako měřítko, protože se jedná o skutečnou hru, může lépe testovat pouze prvky výkonu zařízení s ohledem na potřeby hráče.

Mezitím, ačkoli Cinebench nabízí testování zaměřené na GPU, je z velké části užitečnější pro ty, kteří pracují s 3D vykreslováním, protože vyhovuje více této oblasti, spíše než obecným 3D potřebám.

Existují také benchmarky založené na prohlížeči, ale i když jsou užitečné pro ty, kteří pracují v online oblastech, nebudou tak užitečné pro ty, kteří pracují ve 3D nebo jsou vášnivými hráči.

V ideálním případě si uživatelé musí vybrat srovnávací nástroje, které vyhovují jejich potřebám. Geekbench je jednoduchá a zobecněná testovací sada, ale i když není nejlepší pro konkrétní scénáře, její snadné použití a obecná povaha ji činí ideální pro testování na masovém trhu, například v publikacích.

Přesto, bez ohledu na to, jaký benchmark používáte, nezískáte úplný přehled pro vaše konkrétní potřeby. Stále dostanete indikaci, ale žádné jistoty.

Ten sprinter je skvělý na závody na krátké vzdálenosti, ale asi nebude tak dobrý v tom, aby dělal daně nebo věděl, kde v supermarketu jsou vejce. Vědět, jak se umístí v závodě, vám nepomůže k rychlejšímu vyúčtování, ale budete alespoň vědět, že jsou fyzicky zdatní.

Stejně tak smartphone dokáže dobře plnit konkrétní úkoly v benchmarku, ale stále jde o přiblížení toho, co chcete se zařízením dělat. Můžete například upřednostnit čas potřebný k provedení biometrického odemknutí nebo kvalitu obrazu fotoaparátu.

Srovnávací nástroj poskytne pouze obecný návod, jak je smartphone ve srovnání s jiným za konkrétních podmínek. Neřekne vám, jak dobře zapadne do vašeho života.

Zdroj: appleinsider.com

Podobné příspěvky

Apple Intelligence, iPhone Mirroring a další

Safari 18 přidává novou funkci Highlights pro shrnutí článků

Živý přepis a nahrávání hovorů přichází na iPhone letos na podzim

Mohli jste zmeškat

Apple Intelligence, iPhone Mirroring a další

Safari 18 přidává novou funkci Highlights pro shrnutí článků

Craig Federighi a John Giannandrea hovoří o Apple Intelligence

Živý přepis a nahrávání hovorů přichází na iPhone letos na podzim